白费 labour in vain

约 39,500,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › question
如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2？ - 知乎
DeepSeek团队的每一个人都非常优秀，DeepSeek-V2是群体智慧的结晶，创始人也是我坚信的国内最适合技术驱动型创业的！以及，最重要的，非常期待同样对AGI充满好奇心和创新力的各 …
zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型？ - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性，论文中并没有给出对应的FP8矩阵乘法的算子效率。另外，论文中缺乏per-token加per-channel量化的讨论，不清楚 …
zhihu.com
https://www.zhihu.com › question
deepSeek，可以用来干啥，用了一下感觉和gpt差不多呀？ - 知乎
2024年12月31日 · 本来deepseek与GPT都差不多啊（当然模型内部差异是很大的)，都是LLM（语言类通用大模型）。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一 …
zhihu.com
https://www.zhihu.com › question
如何评价深度求索发布的DeepSeek LLM 67B? - 知乎
2025年3月9日 · DeepSeek（深度求索）近期的大热究竟说明了什么？这表明在美国对中国高科技围堵的态势下，实则是在迫使中国另辟蹊径，走出一条属于自己的路；DeepSeek 的出现还表 …
zhihu.com
https://www.zhihu.com › org
DeepSeek - 知乎
2025年2月28日 · DeepSeek-V3 / R1 推理系统的优化目标是：更大的吞吐，更低的延迟。为了实现这两个目标，我们的方案是使用大规模跨节点专家并行（Expert Parallelism / EP）。首先 …
zhihu.com
https://www.zhihu.com › question
怎样看待深度求索发布的大模型DeepSeek-V3？该模型有 ...
推理速度快：Deepseek V3 每秒的吞吐量可达 60 tokens 模型设计好：Deepseek V3 采用 MoE 结构，完整模型达到 671B 的参数量，其中单个 token 激活 37B 参数模型架构创新 1. 混合专 …
zhihu.com
https://www.zhihu.com › question
DeepSeek-V3-0324 发布，本次 V3 版本有哪些改进？ - 知乎
DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1)，仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错 claude-3.5 在我们的测试下比 claude-3.7 要好一些)。
zhihu.com
https://www.zhihu.com › question
为什么今天下午deepseek的网页版和api调用，生成内容都 ...
2025年1月28日 · 值得庆祝的是当前的DeepSeek V3是一个纯文本模型，不支持多模态功能，这算是其一大弊端。但网页端的DeepSeek是支持图片和文件解析的，是通过单独的功能实现的。 …
zhihu.com
https://www.zhihu.com › question
大家评论「一眼 DeepSeek」时，一般是看到了什么才做出 ...
2025年3月24日 · deepseek文风中“工业香精”味实在太重了，我体会下来deepseek生成回答主要有这么一些特征，这既是它像人的原因，又是它给人恐怖谷感觉的原因。首先就是莫名其妙的比 …
zhihu.com
https://www.zhihu.com › question
deepseek是否被夸大了?个人使用体验感觉不怎么好用? - 知乎
2025年3月1日 · 并不会。我现在最喜欢用的AI是豆包，因为它功能多。第二是deepseek，用的比较少，但是关键时候还是很有意思的。你说的kimi之前我也是用的，个人感觉比豆包稍微智能 …
分页
- 1
- 2
- 3
- 4
- 下一页