约 39,500,000 个结果
在新选项卡中打开链接
  1. 如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2? - 知乎

    DeepSeek团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的! 以及,最重要的,非常期待同样对AGI充满好奇心和创新力的各 …

  2. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚 …

  3. deepSeek,可以用来干啥,用了一下感觉和gpt差不多呀? - 知乎

    2024年12月31日 · 本来deepseek与GPT都差不多啊(当然模型内部差异是很大的),都是LLM(语言类通用大模型)。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一 …

  4. 如何评价深度求索发布的DeepSeek LLM 67B? - 知乎

    2025年3月9日 · DeepSeek(深度求索)近期的大热究竟说明了什么?这表明在美国对中国高科技围堵的态势下,实则是在迫使中国另辟蹊径,走出一条属于自己的路;DeepSeek 的出现还表 …

  5. DeepSeek - 知乎

    2025年2月28日 · DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(Expert Parallelism / EP)。首先 …

  6. 怎样看待深度求索发布的大模型DeepSeek-V3?该模型有 ...

    推理速度快:Deepseek V3 每秒的吞吐量可达 60 tokens 模型设计好:Deepseek V3 采用 MoE 结构,完整模型达到 671B 的参数量,其中单个 token 激活 37B 参数 模型架构创新 1. 混合专 …

  7. DeepSeek-V3-0324 发布,本次 V3 版本有哪些改进? - 知乎

    DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1),仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错 claude-3.5 在我们的测试下比 claude-3.7 要好一些)。

  8. 为什么今天下午deepseek的网页版和api调用,生成内容都 ...

    2025年1月28日 · 值得庆祝的是当前的DeepSeek V3是一个纯文本模型,不支持多模态功能,这算是其一大弊端。但网页端的DeepSeek是支持图片和文件解析的,是通过单独的功能实现的。 …

  9. 大家评论「一眼 DeepSeek」时,一般是看到了什么才做出 ...

    2025年3月24日 · deepseek文风中“工业香精”味实在太重了,我体会下来deepseek生成回答主要有这么一些特征,这既是它像人的原因,又是它给人恐怖谷感觉的原因。首先就是莫名其妙的比 …

  10. deepseek是否被夸大了?个人使用体验感觉不怎么好用? - 知乎

    2025年3月1日 · 并不会。我现在最喜欢用的AI是豆包,因为它功能多。第二是deepseek,用的比较少,但是关键时候还是很有意思的。你说的kimi之前我也是用的,个人感觉比豆包稍微智能 …

刷新