Skip to content

NJUDeepEngine/llm-course-lecture

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

85 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

大语言模型基础:从零到一实现之路

Course Badge Year Language

一门理论与实践并重的大语言模型课程,带你从零开始理解和实现LLM的各个组件(内容由Cursor生成hhh)

📚 课程简介

本课程旨在深入浅出地讲解大语言模型(Large Language Models, LLMs)的基础理论和实践实现。通过"从零到一"的学习路径,你将不仅理解LLM的工作原理,还能亲手实现各个核心组件。

🎯 课程目标

  • 理论基础:掌握LLM的数学原理和架构设计
  • 实践能力:从零开始实现LLM的各个组件
  • 工程技能:学习PyTorch、Transformers等主流框架的使用
  • 前沿技术:了解FlashAttention、分布式训练等高级技术

👨‍🏫 课程团队

  • 主讲教师:徐经纬
  • 办公室:计算机学院1022
  • 邮箱jingweix@nju.edu.cn
  • 课程联合创始人:黄云鹏
  • 2025助教团队:赵世驹、梁明宇、卜韬、王乾刚、徐鼎坤

🌐 相关链接

📖 课程大纲

2025年课程内容

  1. 课程简介 - 课程概述和学习路径
    讲义链接: https://njudeepengine.github.io/llm-course-lecture/2025/lecture1.html

    B站链接: https://www.bilibili.com/video/BV12RemzSEfV

  2. 特征空间的变换1 - 前反向运行视角理解深度学习模型
    讲义链接: https://njudeepengine.github.io/llm-course-lecture/2025/lecture2.html

  3. 特征空间的变换2 - 前反向运行视角理解深度学习模型
    讲义链接: https://njudeepengine.github.io/llm-course-lecture/2025/lecture3.html

    B站链接: https://www.bilibili.com/video/BV1EJH9zRE2p

2024年课程内容

基础理论

  1. 课程简介 - 课程概述和学习路径
  2. 深度学习基础 I - PyTorch基础和基本概念
  3. 深度学习基础 II - 反向传播和优化算法
  4. 大语言模型解析 I - Tokenizer和Positional Embedding
  5. 大语言模型解析 II - RMSNorm和MLP
  6. 大语言模型解析 III - Attention Layer
  7. 大语言模型解析 IV - Flash Attention
  8. 大语言模型解析 V - MoE和LoRA
  9. 大语言模型解析 VI - Fine-tuning

高级技术

  1. 大语言模型解析 VII - LLM save/load
  2. 大语言模型解析 VIII - LLM推理、解码策略、KVCache
  3. 大语言模型推理技术 - RAG基础
  4. 大语言模型推理技术 - RAG进阶
  5. 大语言模型进阶 - Megatron中的并行化技术

🎓 评分体系

  • 从零到一之路:5次编程作业 (80%)
  • 启动:大作业:综合项目 (20%)

⚠️ 注意:作业过程可能对GPU资源有一定要求(感谢AMD的鼎力支持)

🚀 技术栈

核心框架

高级技术

📚 学习资源

推荐阅读

开源项目

📞 联系方式


⭐ 如果这个课程对你有帮助,请给个Star支持一下!⭐

让更多人能够学习到大语言模型的奥秘

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors