国内版
国际版
网页
图片
视频
短视频
学术
词典
地图
更多
航班
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
优酷
酷6
土豆
6.cn
Joy
新浪
搜狐
CCTV
价格
全部
免费
付费
清除筛选条件
筛选器
7106592057006752269
1 个月前
ixigua.com
1:56
一分钟梳理 30年 强化学习发展史 一分钟梳理近30年强化学习发展史: 从92年William提出策略梯度,到Sutton 提出Actor-Critic结构,再到DeepMind搞出DQN, 后面到shulman提出PPO以及后面的DPO, GRPO, Dr.GRPO, DSPO, GSPO等一系列,以减少稀疏奖励、稳定策略优化为目的的算法。30年,一路走来,强化学习,从“试错”逐步走向”理解人类
3 个月之前
douyin.com
边山李博士
1:06
高效迭代 高手的自我进化方法论
已浏览 34 次
3 个月之前
bilibili
小欣资料库
14:33
最优执行不该交给黑箱强化学习,成本、市场冲击与风险之间找到更优平衡
已浏览 1380 次
2 周前
bilibili
AI量化邹老师
5:08
降维打击!揭秘性能飙升18.7%的A I「原子化」进化!
已浏览 383 次
1 个月前
bilibili
沐冰茶
20:28
相变和临界现象 :伊辛模型、重整化群和标度不变性 统计物理
已浏览 5097 次
1 个月前
bilibili
北游知
90%的炼丹师都在用,却没搞懂的权重衰减,大白话 硬核推导全覆盖
已浏览 5971 次
2 个月之前
bilibili
算法魔法师
3:33:58
𝑀𝒶𝓀𝒾 𝟚𝟘𝟚𝟝𝟘𝟙𝟚𝟙
已浏览 2811 次
2025年1月22日
bilibili
LmyNBL
STILL HERE: THE RELENTLESS INCREMENTALIST WITH DAN FOLLIARD - Nyla Technology Solutions
1 周前
nylatechnologysolutions.com
Hemingway: Alito Cares About Religious Liberty 'A Great Deal'
3 周前
thefederalist.com
✂️ Al Pacino | Chris Miller - Chief InCreMentalist
已浏览 3818 次
2 个月之前
linkedin.com
British Columbia Shows Norway How To Decarbonize Ferries - CleanTechnica
2025年1月3日
cleantechnica.com
2:52
指数级成长的杠杆法则「培养输出型能力」
已浏览 2473 次
2025年5月13日
bilibili
爱思考的Lala
1:02:45
【人工智能基础】第48讲:策略梯度-Reinforce-Actor Critic
已浏览 3095 次
2024年9月9日
bilibili
上海大学-刘树林
6:46
集成学习:AI的团队智慧
已浏览 324 次
3 个月之前
bilibili
玉米学AI
0:31
轻Rogue弹幕融合丨游戏创意
已浏览 561 次
4 个月之前
bilibili
游戏掰一点
1:12:14
【公开课】渐进主义和间断的进化平衡模型
已浏览 359 次
2022年7月19日
bilibili
小斯正在努力学习
9:23
【粉丝答疑】迭代数列的渐进分析与估计 | 第三次讲解渐进分析 | 数学分析 | 数列极限 | 加边法
已浏览 1653 次
2022年12月6日
bilibili
棱镜数学Studio
3:02
耗时半个月,我造了一个擅长研究的AI实习生
已浏览 2016 次
2025年5月9日
bilibili
Lion3D
41:29
具身智能里程碑,一节课速通迭代残差策略IRP框架
已浏览 1350 次
7 个月之前
bilibili
啥都会一点的研究生
3:29:59
梯度的机器学习双水平优化 Wasserstein分布鲁棒学习 l_0正则化非平滑凸回归问题 渐进迭代最小二乘拟合逼近 用于求解线性系统序列的块krylov解法
已浏览 211 次
2024年8月10日
bilibili
大学生自学提升课程
57:19
CM08-线性方程组迭代解法
已浏览 4229 次
2020年2月19日
bilibili
胡清方
8:32
1-07 迭代与增量开发周期有什么差异
已浏览 1072 次
2020年11月30日
zhihu.com
Guolin
44:39
最深度の消费者理论大公开!你不知道的MRS递减和拟凹函数原来是这样用的!
已浏览 800 次
2022年1月4日
zhihu.com
穗宇优课
10:21
【强化学习】策略梯度方法-REINFORCE with Baseline & Actor-Critic
已浏览 1.1万 次
2022年3月16日
bilibili
shuhuai008
0:38
休闲挂机游戏《咖啡星矿工》Steam页面上线
已浏览 356 次
2025年3月21日
bilibili
SpaceJazzGames官方
2:03
交叉学科团队开源“降阶法”:如何将学习效率从对数增长扭转为指数暴涨?
已浏览 2635 次
3 个月之前
bilibili
深度降阶
展开
反馈