国内版
国际版

个人资料图片
  • 网页
  • 图片
  • 视频
    • 短视频
  • 学术
  • 词典
  • 地图
  • 更多
    • 航班
  • 笔记本
报告不当内容
请选择下列任一选项。
  • 时长
    全部短(小于 5 分钟)中(5-20 分钟)长(大于 20 分钟)
  • 日期
    全部过去 24 小时过去一周过去一个月去年
  • 清晰度
    全部低于 360p360p 或更高480p 或更高720p 或更高1080p 或更高
  • 源
    全部
    优酷
    酷6
    土豆
    6.cn
    Joy
    新浪
    搜狐
    CCTV
  • 价格
    全部免费付费
  • 清除筛选条件
    筛选器
    强化学习后训练 怎么适应主流大模型变化? 【强化学习后训练 怎么适应主流大模型变化?】主流大模型结构,从最初的基础 Transformer 架构,发展到 MoE 与 Sparse MoE 这样的条件计算模型;随后又出现了以 State-Space Model 为核心的 Mamba,以及 LeCun 团队提出的 Hyena 等非注意力序列建模架构;再到当前逐渐成为趋势的 State-Space 与
    2:13
    强化学习后训练 怎么适应主流大模型变化? 【强化学习后训练 怎么适应主流大模型变化?】主流大模型结构,从最初的基础 Transformer 架构,发展到 MoE 与 Sparse MoE 这样的条件计算模型;随后又出现了以 State-Space Model 为核心的 Mamba,以及 LeCun 团队提出的 Hyena 等非注意力序列建模架构;再到当前逐渐成为趋势的 State-Space 与
    5 个月之前
    douyin.com边山李博士
    展开
    静态缩略图占位符
    反馈
    • 隐私
    • 条款