hcie8045 发表于 2025-2-10 08:56:18

从零训练DeepSeek R1 Distill模型|模型蒸馏技术实战

本帖最后由 hcie8045 于 2025-2-10 09:50 编辑

1.DeepSeek R1模型蒸馏实战.mp4
2.DeepSeek R1开源情况介绍.mp4
3.推理大模型主流训练思路介绍.mp4
4.模型蒸馏概念入门与DeepSeek R1模型蒸馏思路.mp4
5.DeepSeek R1模型蒸馏基本环境搭建.mp4
6.模型蒸馏数据集准备与数据清洗.mp4
7.DeepSeek R1模型蒸馏实战及蒸馏前后模型性能对比.mp4

**** Hidden Message *****

DSQ 发表于 2025-2-10 09:09:33

666666666666

sb1 发表于 2025-2-10 10:16:19

谢谢

JxStyle 发表于 2025-2-10 10:31:47

蒸馏

chen_001 发表于 2025-2-10 10:46:19

Aa

wm378802548 发表于 2025-2-10 10:47:31

看下 感谢分享

ssjno 发表于 2025-2-10 11:31:49

666

allspark 发表于 2025-2-10 11:45:28

thanks

yang 发表于 2025-2-10 12:21:17

66666666666666666666666666

xiaowang 发表于 2025-2-10 13:26:06

:(
页: [1] 2 3 4
查看完整版本: 从零训练DeepSeek R1 Distill模型|模型蒸馏技术实战