性爱一区在线观看|免费黄色大片软件|欧美日韩国产无码|se01欧美在线播放|亚洲性爱勉费视频|亚洲国产美女搞黄色|91在线欧洲一级黄片片|免费观看亚洲黄色a片|亚洲欧美小说图片视频|成人黄色三级片电影

上海交大教育集團IT研究院

7x24小時咨詢熱線

400-660-3310

當前位置 : 好學校 上海人工智能 上海交大教育集團IT研究院 課程正文

人看過 人預約 收藏分享

上海DeepSeek蒸餾技術與模型核心原理培訓

授課方式 :
上課時段:

上課校區(qū):

報讀該課程可在好學校領取返現(xiàn)獎勵20元。

微信掃碼添加老師好友咨詢

上海交大教育集團IT研究院

上海交大教育集團IT研究院

認證等級

信譽良好,可安心報讀

上海交大教育集團IT研究院

已獲好學校V2信譽等級認證

信譽值

  • (60-80)基礎信譽積累,可放心報讀
  • (81-90)良好信譽積累,可持續(xù)信賴
  • (91-100)充分信譽積累,推薦報讀

與好學校簽訂讀書保障協(xié)議:

在線咨詢
2025.12.10 郭*磊 180*****217 咨詢了 上課時段
2025.12.09 w*x 187*****273 咨詢了 開課校區(qū)
2025.12.07 先*生 150*****218 咨詢了 課程費用
2025.12.05 譚* 189*****620 咨詢了 招生對象
2025.12.04 J*n 177*****148 咨詢了 開班時間
2025.12.03 郭*士 137*****214 咨詢了 課程費用
2025.12.02 機*主 132*****436 咨詢了 上課時段
2025.11.28 王* 187*****134 咨詢了 課程費用
2025.11.28 張*學 188*****372 咨詢了 開班時間
2025.11.28 張*良 184*****267 咨詢了 招生對象
2025.11.27 甄*思 156*****770 咨詢了 上課時段
2025.11.27 嚴* 185*****653 咨詢了 上課時段
2025.11.26 鄭*榮 159*****759 咨詢了 開課校區(qū)
2025.11.25 先*生 185*****172 咨詢了 招生對象
2025.11.24 機*主 152*****810 咨詢了 上課時段
2025.11.23 劉* 185*****350 咨詢了 招生對象
2025.11.23 安*生 138*****000 咨詢了 周邊交通
2025.11.22 張* 151*****780 咨詢了 周邊交通
2025.11.22 機*主 135*****065 咨詢了 開班時間
2025.12.01 鄭*生 150*****669 咨詢了 課程費用
上海DeepSeek蒸餾技術與模型核心原理培訓

【培訓天數(shù)】

3天/24課時

【課程概述】

本課程聚焦于 DeepSeek R1 模型蒸餾 Qwen2 1.5B 的實踐操作,旨在讓學員掌握模型蒸餾的全流程,包括環(huán)境部署、數(shù)據(jù)集準備、蒸餾過程及調用測試,提升學員在大模型應用與優(yōu)化領域的實踐能力。課程還包含DeepSeek V3 模型核心原理、整體架構、分布式基礎概念、MLA嵌在注意力從自回歸掩碼看KV緩存機制,針對KV緩存的改進,DeepSeek MOE架構與創(chuàng)新介紹。

【課程目標】

能夠獨立搭建 DeepSeek R1 模型蒸餾 Qwen2 1.5B 的實驗環(huán)境,包括創(chuàng)建虛擬環(huán)境、安裝相關依賴和工具。

熟悉多種可用于模型蒸餾的數(shù)據(jù)集,掌握數(shù)據(jù)集的清洗和準備方法,能根據(jù)需求篩選和處理數(shù)據(jù)。

理解并熟練執(zhí)行模型蒸餾過程,運用 Llama - Factory 進行全量指令微調,優(yōu)化模型性能。

學會對蒸餾前后的模型進行調用測試,準確評估模型在實際問題解決中的表現(xiàn),分析模型的優(yōu)勢與不足。

【課程亮點】

實戰(zhàn)派學習

從DeepSee-R1入門介紹,到模型蒸餾項目實戰(zhàn)的講解,再到核心原理介紹,由淺入深便于理解世界高級大模型背后的奧秘。

完整的訓練腳本和數(shù)據(jù)集

課程會分享講解過程中所使用的訓練腳本、代碼、數(shù)據(jù)集,并提供參考的部署環(huán)境,可通過課后練習復現(xiàn)加深印象。

技術報告創(chuàng)新點剖析

不用通篇閱讀官方技術報告的,通過課程講解即可了解到DeepSeek-R1/V3核心創(chuàng)新點。

本地部署與私有化方案

介紹本地部署所需要的軟硬件資源調配。

第一天 DeepSeek-R1蒸餾Qwen1.5B實戰(zhàn) 

(一)模型蒸餾環(huán)境部署

1. 操作系統(tǒng)與配置說明

2. 創(chuàng)建虛擬環(huán)境

3. 創(chuàng)建 Jupyter Kernel

4. 安裝 wand

5. 創(chuàng)建主目錄與下載原始模型

6. 安裝 Llama - Factory

(二)模型蒸餾數(shù)據(jù)集準備

1. 主流推理數(shù)據(jù)集介紹

2. 數(shù)據(jù)清洗過程

3. 數(shù)據(jù)集下載與準備

(三)模型蒸餾過程

1. 上傳微調腳本

2. 執(zhí)行微調

(四)調用測試

1. 測試問題設置

2. 普通模型調用測試

3. 蒸餾模型調用測試

第二天 DeepSeek-V3模型核心原理與架構介紹

(一)DeepSeekv3 架構圖解與基本參數(shù)配置

(1)整體架構

(2)不同規(guī)模模型參數(shù)

(3)關鍵參數(shù)配置

(二)分布式并行化嵌入與映射

(1)ParallelEmbedding 層

(2)線性層相關實現(xiàn)

(3)行并行與列并行

(三)RMS Norm 層

(1)Layer Normalization 介紹

(2)LN 與 BN、RMSNorm 的差別

(3)RMSNorm 實現(xiàn)

(四)旋轉位置編碼 ROPE

(1)原理與優(yōu)勢

(2)具體流程

(3)相關代碼實現(xiàn)

(五)DeepSeek v3 的 KV 緩存機制

(1)工作原理

(2)類定義與初始化

(3)forward 方法

第三天 DeepSeek v3 MLA 機制與混合專家模型介紹 

(一)DeepSeek v3 的 MOE 混合專家模型

(1)與常見前饋網絡對比

(2)SwiGLU 激活函數(shù)

(3)MoE 原理與優(yōu)勢

(4)MoE 訓練流程

(5)專家選擇機制

(6)瓶頸問題與輔助損失

(7)MoE 推理過程

(8)相關類定義

(二)DeepSeek v3 的 KV 緩存機制

(1)自回歸算法與 KV 緩存

(2)注意力機制計算分析

(3)KV 緩存工作流程

(4)MLA 潛在注意力機制

(5)相關類定義與初始化

【環(huán)境展示】

環(huán)境展示

環(huán)境介紹

【教學模式】

1、隨到隨學

學員報名之后立馬就可以開始學習, 無需再等人數(shù)夠了再開班,每個學員都可以根據(jù)自己的時間安排制定自己的學習計劃,不會再因為時間不統(tǒng)一落下課。

2、多對一輔導

授課老師、助教老師、班主任、就業(yè)指導老師4對1的服務模式,學員可以實時在線在線與授課老師和助教老師1對1溝通問題,就業(yè)指導老師會在就業(yè)前對學員進行1對1就業(yè)指導。

3、免費重修機制

學員報名就業(yè)課程學制結束未成功就業(yè),不限次數(shù)免費重修。報名課程學不會,效果不理想,可申請免費換課。更有多種支付學費的方式可以提供。

4、名企推薦就業(yè)

我們已經和超過500家企業(yè)建立人才推薦合作,遍及全國20多個城市,參加我們就業(yè)實訓類培訓的學員都可以獲得免費推薦就業(yè)的機會,我們的課程的宗旨就是系統(tǒng)學習IT技術,為你的職場晉升助力。

開班信息

學時
學費
操作

    校區(qū)地址

    廣州
    上海
    二維碼

    微信掃一掃,發(fā)送到手機

    隨時隨地,用手機查看地圖路線,更可實時導航,輕松到校!

    學校相冊

    更多 >
    環(huán)境/教學大圖
    環(huán)境/教學大圖
    環(huán)境/教學大圖
    環(huán)境/教學大圖

    學員點評

    92%滿意度

    上海交大教育集團IT研究院

    綜合

    環(huán)境 : 4.6師資 : 4.6教學 : 4.6

    15063人看過    1791人預約    5人評價
    鄭*生

    鄭*生

    私信AT
    有用(0請教

    (環(huán)境:5.0師資:5.0教學:5.0

    老師比較專業(yè),課程培訓和考試培訓都相對比較完善,期待下一次的課程教學

    2025-11-29

    韓*生

    韓*生

    私信AT
    有用(0請教

    (環(huán)境:5.0師資:5.0教學:5.0

    培訓到位,服務很周到。老師講解細致入微。

    2025-08-30

    張*吉

    張*吉

    私信AT
    有用(2請教

    (環(huán)境:5.0師資:5.0教學:5.0

    老師講課負責認真
    內容完全按實操
    老師也非常樂意解答實際工作遇到的問題

    2024-09-06

    讀書保障 :

    • 正規(guī)資質

      所有學校都經過好學校品牌認證,辦學許可證、工商營業(yè)執(zhí)照。

    • 免費求學顧問

      通過好學校咨詢,你可獲得好學校免費求學顧問1對1專業(yè)服務,助你快速找到滿意學校!

    • 優(yōu)質教學

      通過好學校報讀,你將可在好學校進行課程點評,你的評價將影響學校招生,學校會更重視你,給你更優(yōu)質教學,避免你差評。

    • 消費權益保障

      通過好學校報讀,若你與學校發(fā)生糾紛,你可獲得好學校來自第三方的平臺保障,協(xié)助你讓學校退款,維護你的合法權益!

    更多適合課程

    全城人工智能學校,一網打盡,立即搜索:

    城市 : 求學課程 : 上課時間 :

    課程咨詢

    好學校二維碼

    隨時隨地與老師微信互動

    在線預約免費試聽

    • 現(xiàn)在免費預約試聽,報名可最高返現(xiàn)
    • 獲取驗證碼
    官方授權聲明

    尊敬的平臺會員您好,[上海交大教育集團IT研究院]資質文件正在審核中。如需了解[上海交大教育集團IT研究院]服務明細或申請試聽服務,
    請點擊:聯(lián)系客服。

    ;