国内版
国际版
网页
图片
视频
短视频
学术
词典
地图
更多
航班
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
优酷
酷6
土豆
6.cn
Joy
新浪
搜狐
CCTV
价格
全部
免费
付费
清除筛选条件
筛选器
11:11
【2026版】这绝对是B站把强化学习DPO算法实战从入门到精通讲明白的
…
已浏览 9750 次
2 个月之前
bilibili
AI大模型技术
19:19
【DPO】直接偏好优化 详细原理推导 快速上手实战
已浏览 4856 次
1 个月前
bilibili
东川路第一可爱猫猫虫
16:05
DPO算法实操:大模型偏好对齐与DPO算法实战,Agent与MCP的工
…
已浏览 2914 次
6 个月之前
bilibili
AI大模型_
23:17
完全从零开始实现DPO算法,不依赖trl库,已经实现预训练、SFT、DP
…
已浏览 1.9万 次
2024年12月12日
bilibili
偷星九月333
1:55
【绝了】B站最好的强化学习教程&DPO算法实战全代码流程强势出
…
已浏览 1119 次
6 个月之前
bilibili
小全栈
5:00
股票DPO指标介绍和使用方法
2022年10月16日
sohu
肃总
4:58
构建大语言模型,DPO训练方法,原理和实现
已浏览 1.6万 次
2023年11月1日
bilibili
蓝斯诺特
14:26
手把手实现大模型偏好对齐!DPO算法原理解析与代码级实战,简直配享
…
已浏览 590 次
6 个月之前
bilibili
码士集团-IT早知道
7:15
3年时间从17万到257万,坚持只用---DPO指标,精准预测,只差分毛!简
…
已浏览 3195 次
10 个月之前
bilibili
牛散方新侠
52:12
DPO:人类偏好对齐技术——大模型训练的最后一公里
已浏览 1.2万 次
2024年9月15日
bilibili
NobleAI
17:02
大模型微调第7节-DPO算法的原理及案例
已浏览 1310 次
7 个月之前
bilibili
雨落实战
7:21
106.RL专题:介绍下DPO执行的流程
已浏览 2030 次
10 个月之前
bilibili
文言AI
9:30
监督对齐DPO算法实例讲解
已浏览 85 次
4 个月之前
bilibili
酌沧
8:14
16大模型全栈-强化学习09-DPO变体:TDPO:更细粒度控制的DPO;RP
…
已浏览 2543 次
2024年7月2日
bilibili
大模型解码室
36:25
DPO算法详解 : Direct Preference Optimization 算法详解 (RLHF的替代
…
已浏览 2654 次
2023年12月12日
bilibili
聚焦AIGC
7:15
5年时间从7万到256万,只坚持用---DPO指标,精准预测,只差分毛!简
…
已浏览 3万 次
2025年2月6日
bilibili
N型龙头战法
21:15
DPO直接偏好优化算法 (动画讲解)
已浏览 8544 次
2024年10月26日
bilibili
数源创域
18:33
12.DPO实操,五步完成基座模型准备、数据集下载、策略模型和参考模
…
已浏览 2848 次
10 个月之前
bilibili
码农野蛮生长
44:50
【DPO衍生算法串讲-Part 2】SimPO,ORPO Part 1 推导过程 (r2
…
已浏览 3595 次
2024年11月25日
bilibili
一心豆儿
11:59
13大模型全栈-强化学习06-DPO流程、代码以及损失函数介绍
已浏览 7309 次
2024年6月30日
bilibili
大模型解码室
7:32
5年时间从7万到256万,只坚持用---DPO指标,精准预测,只差分毛!简
…
已浏览 526 次
7 个月之前
bilibili
疯子选股
10:06
面试官:PPO与DPO的区别??被问懵了。。AI大模型面试必看!
已浏览 7259 次
9 个月之前
bilibili
AI大模型大课堂
6:04
学点简单的DPO和GSPO 你是不是忘了? 我是忘了 复习起来 学不动了 不你
…
已浏览 1667 次
7 个月之前
bilibili
凶猛肱二头
4:15
【ComfyUI实测】告别AI塑料脸!Flow-DPO技术有多强?Z-Image-Turbo Flo
…
已浏览 3153 次
3 周前
bilibili
电磁波Studio
12:17
DPO区间震荡线指标
已浏览 1750 次
2022年9月28日
bilibili
良言万语
7:15
史上最神秘的指标:DPO指标,抓主升浪成功率竟高达90%!超过99%的
…
已浏览 1188 次
5 个月之前
bilibili
牛散小鳄鱼
20:25
【DPO衍生算法串讲-Part 1】r2Q*,Step-DPO,RTO,TDPO,Si
…
已浏览 5335 次
2024年11月11日
bilibili
一心豆儿
7:20
5年时间从7万到256万,只坚持用---DPO指标,精准预测,只差分毛!简
…
已浏览 1031 次
10 个月之前
bilibili
炒股养家学
9:15
【大模型面经】PPO与DPO的区别在哪里?一个视频讲明白!
已浏览 433 次
4 个月之前
bilibili
醒醒该敲代码了_
7:20
5年时间从7万到256万,只坚持用---DPO指标,精准预测,只差分毛!简
…
已浏览 2817 次
2025年3月12日
bilibili
炒股养家学
观看更多视频
反馈