可靠 credibility

约 39,500,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型？ - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性，论文中并没有给出对应的FP8矩阵乘法的算子效率。另外，论文中缺乏per-token加per-channel量化的讨论，不清楚 …
zhihu.com
https://www.zhihu.com › question
如何评价深度求索发布的DeepSeek LLM 67B? - 知乎
2025年3月9日 · DeepSeek（深度求索）近期的大热究竟说明了什么？这表明在美国对中国高科技围堵的态势下，实则是在迫使中国另辟蹊径，走出一条属于自己的路；DeepSeek 的出现还表 …
zhihu.com
https://www.zhihu.com › question
deepSeek，可以用来干啥，用了一下感觉和gpt差不多呀？ - 知乎
2024年12月31日 · 本来deepseek与GPT都差不多啊（当然模型内部差异是很大的)，都是LLM（语言类通用大模型）。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一 …
zhihu.com
https://www.zhihu.com › question
怎样看待深度求索发布的大模型DeepSeek-V3？该模型有 ...
推理速度快：Deepseek V3 每秒的吞吐量可达 60 tokens 模型设计好：Deepseek V3 采用 MoE 结构，完整模型达到 671B 的参数量，其中单个 token 激活 37B 参数模型架构创新 1. 混合专 …
zhihu.com
https://www.zhihu.com › question
如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2？ - 知乎
DeepSeek团队的每一个人都非常优秀，DeepSeek-V2是群体智慧的结晶，创始人也是我坚信的国内最适合技术驱动型创业的！以及，最重要的，非常期待同样对AGI充满好奇心和创新力的各 …
zhihu.com
https://www.zhihu.com › question
DeepSeek-V3-0324 发布，本次 V3 版本有哪些改进？ - 知乎
DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1)，仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错 claude-3.5 在我们的测试下比 claude-3.7 要好一些)。
zhihu.com
https://www.zhihu.com › question
deepseek R1 只支持文本，不支持多模态吗？ - 知乎
2025年2月26日 · 早期的 DeepSeek-R1 主要专注于文本任务，例如智能对话、文本生成、代码补全、数学推理等。部分搜索结果提到，在 2025 年 1 月发布的版本中，DeepSeek-R1 尚未支 …
zhihu.com
https://www.zhihu.com › org
DeepSeek - 知乎
2025年2月28日 · DeepSeek-V3 / R1 推理系统的优化目标是：更大的吞吐，更低的延迟。为了实现这两个目标，我们的方案是使用大规模跨节点专家并行（Expert Parallelism / EP）。首先 …
zhihu.com
https://www.zhihu.com › question
deepseek是否被夸大了?个人使用体验感觉不怎么好用? - 知乎
2025年3月1日 · 并不会。我现在最喜欢用的AI是豆包，因为它功能多。第二是deepseek，用的比较少，但是关键时候还是很有意思的。你说的kimi之前我也是用的，个人感觉比豆包稍微智能 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
DeepSeek-70B本地化部署指南！断网也能轻松装，超实用！
2025大年初一的时候我曾发了一篇如何在本地部署DeepSeek大模型的流程教程，意外的获得了超多的点击和收藏，也了解到了许多用户遇到的问题，经过一段时间的使用，我发现蒸馏过 …
分页
- 1
- 2
- 3
- 4
- 下一页