约 39,500,000 个结果
在新选项卡中打开链接
  1. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚 …

  2. 如何评价深度求索发布的DeepSeek LLM 67B? - 知乎

    2025年3月9日 · DeepSeek(深度求索)近期的大热究竟说明了什么?这表明在美国对中国高科技围堵的态势下,实则是在迫使中国另辟蹊径,走出一条属于自己的路;DeepSeek 的出现还表 …

  3. deepSeek,可以用来干啥,用了一下感觉和gpt差不多呀? - 知乎

    2024年12月31日 · 本来deepseek与GPT都差不多啊(当然模型内部差异是很大的),都是LLM(语言类通用大模型)。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一 …

  4. 怎样看待深度求索发布的大模型DeepSeek-V3?该模型有 ...

    推理速度快:Deepseek V3 每秒的吞吐量可达 60 tokens 模型设计好:Deepseek V3 采用 MoE 结构,完整模型达到 671B 的参数量,其中单个 token 激活 37B 参数 模型架构创新 1. 混合专 …

  5. 如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2? - 知乎

    DeepSeek团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的! 以及,最重要的,非常期待同样对AGI充满好奇心和创新力的各 …

  6. DeepSeek-V3-0324 发布,本次 V3 版本有哪些改进? - 知乎

    DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1),仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错 claude-3.5 在我们的测试下比 claude-3.7 要好一些)。

  7. deepseek R1 只支持文本,不支持多模态吗? - 知乎

    2025年2月26日 · 早期的 DeepSeek-R1 主要专注于文本任务,例如智能对话、文本生成、代码补全、数学推理等。 部分搜索结果提到,在 2025 年 1 月发布的版本中,DeepSeek-R1 尚未支 …

  8. DeepSeek - 知乎

    2025年2月28日 · DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(Expert Parallelism / EP)。首先 …

  9. deepseek是否被夸大了?个人使用体验感觉不怎么好用? - 知乎

    2025年3月1日 · 并不会。我现在最喜欢用的AI是豆包,因为它功能多。第二是deepseek,用的比较少,但是关键时候还是很有意思的。你说的kimi之前我也是用的,个人感觉比豆包稍微智能 …

  10. DeepSeek-70B本地化部署指南!断网也能轻松装,超实用!

    2025大年初一的时候我曾发了一篇如何在本地部署DeepSeek大模型的流程教程,意外的获得了超多的点击和收藏,也了解到了许多用户遇到的问题,经过一段时间的使用,我发现蒸馏过 …

刷新