寥寥无几 thin on the ground

约 504,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › tardis › zm › art
LORA：大模型轻量级微调
2025年1月21日 · LORA 的这种思想有点类似于残差连接，同时使用这个旁路的更新来模拟 Full Fine-Tuning的过程。并且，Full Fine-Tuning可以被看做是 LoRA 的特例（当等于时）。在推 …
zhihu.com
https://www.zhihu.com › question
如何理解LoRa技术，有哪些应用？ - 知乎
2017年3月3日 · 简单来讲，lora是大模型的低秩适配器，或者就简单的理解为适配器，在图像生成中可以将lora理解为某种图像风格（比如SD社区中的各种漂亮妹子的lora，可插拔式应用，甚 …
zhihu.com
https://www.zhihu.com › question
lora 模型的运作原理是怎样的？ - 知乎
LoRA：低秩适配器的核心思想 LoRA 是一种更进一步的适配器技术，它通过插入低秩矩阵（Low-Rank Matrices）作为适配器模块，将高维矩阵压缩为更小的低秩矩阵，从而显著减少参数量。 …
zhihu.com
https://www.zhihu.com › question
LoRA这种微调方法和全参数比起来有什么劣势吗？ - 知乎
LoRA的分析观察2 当多个 LoRA 模块在不同数据上独立训练时，不同头的矩阵 A 参数趋于一致，而矩阵 B 的参数则明显可区分。下图展示了 LoRA 模块的分解分析，通过 t-SNE 比较。各 …
zhihu.com
https://www.zhihu.com › question
阿里的 LoRaWAN 标准为什么成为中国的 LoRa 无线空口标准？
LoRa暗藏局域网基因？在讲这个问题前，我们来了解一下LoRa技术的部分基本技术指标。首先，LoRa采用扩频技术，工作在非授权频段，ISM频段包括433MHz、470MHz、868MHz、915 …
zhihu.com
https://www.zhihu.com › question
在comfyui中，如何加载多个lora，但不混用，顺次使用？ - 知乎
2024年12月16日 · 请问我想在工作流里加载多个lora，但每次成图只使用其中一个，然后把所有lora遍历一遍，这个要如何操作。比如我加载了3个lora，就想生成3张图，分… 显示全部
zhihu.com
https://www.zhihu.com › question
高效参数微调方法lora微调矩阵旁路矩阵A和B为什么要这么 ...
2025年4月14日 · 逐步引入LoRA调整：如果B矩阵初始化为零，那么在训练初期 \Delta W = A \times B = 0 ，这意味着LoRA的调整不会立即生效，模型完全依赖于预训练的权重 W_0 。这种 …
zhihu.com
https://www.zhihu.com › question
LORA 的速度如何与其他无线通信技术相比？ - 知乎
2024年6月17日 · LORA的传输速率通常在10kbps到50kbps之间，这比其他无线通信技术如Wi-Fi（20Mbps至数百Mbps）、蓝牙（1Mbps）和Zigbee（20kbps至200kbps）等要慢得多。 …
zhihu.com
https://www.zhihu.com › question
请问如果我下载了别人训练的ai模型（lora模型），并用在某个 ...
2023年12月6日 · 侵权不可知——lora模型训练的过程对法院来说是黑箱。两个lora模型代码是一致的因为是同一代码规范；但参数肯定是不同的，不过表现参数不一致，根本不能确定侵权，因 …
zhihu.com
https://www.zhihu.com › tardis › zm › art
大模型轻量级微调（LoRA）：训练速度、显存占用分析
2025年1月22日 · LoRA 模型的权重、梯度、优化器状态都需要存储，这是毫无疑问的。结论：LoRA在显存方面就只是节省了主干模型的优化器状态。另外，实际使用中，我们可以利用 …
分页
- 1
- 2
- 3
- 4
- 下一页