Name	Name	Last commit message	Last commit date
parent directory ..
PPT	PPT
REF	REF
code	code
cover	cover
data/multi30k	data/multi30k
images	images
images_src	images_src
srt	srt
01Transformer.md	01Transformer.md
01Transformer.pdf	01Transformer.pdf
02Tokenizer.md	02Tokenizer.md
02Tokenizer.pdf	02Tokenizer.pdf
03Embeding.md	03Embeding.md
03Embeding.pdf	03Embeding.pdf
04Attention.md	04Attention.md
04Attention.pdf	04Attention.pdf
05GQAMLA.md	05GQAMLA.md
05GQAMLA.pdf	05GQAMLA.pdf
06LongSeq.pdf	06LongSeq.pdf
07Parameter.md	07Parameter.md
07Parameter.pdf	07Parameter.pdf
CODE01MiniTranformer.ipynb	CODE01MiniTranformer.ipynb
CODE01MiniTranformer.md	CODE01MiniTranformer.md
CODE02TransformerTrain.ipynb	CODE02TransformerTrain.ipynb
CODE02TransformerTrain.md	CODE02TransformerTrain.md
CODE03MachineTrans.ipynb	CODE03MachineTrans.ipynb
CODE03MachineTrans.md	CODE03MachineTrans.md
CODE04Sinusoidal.ipynb	CODE04Sinusoidal.ipynb
CODE04Sinusoidal.md	CODE04Sinusoidal.md
CODE05BPE.ipynb	CODE05BPE.ipynb
CODE05BPE.md	CODE05BPE.md
CODE06Embedding.ipynb	CODE06Embedding.ipynb
CODE06Embedding.md	CODE06Embedding.md
CODE07Attention.ipynb	CODE07Attention.ipynb
CODE07Attention.md	CODE07Attention.md
README.md	README.md
transformer_components.py	transformer_components.py

Name

Last commit message

Last commit date

CODE01MiniTranformer.ipynb

CODE01MiniTranformer.md

CODE02TransformerTrain.ipynb

CODE02TransformerTrain.md

CODE03MachineTrans.ipynb

CODE03MachineTrans.md

CODE04Sinusoidal.ipynb

CODE04Sinusoidal.md

CODE05BPE.ipynb

CODE05BPE.md

CODE06Embedding.ipynb

CODE06Embedding.md

CODE07Attention.ipynb

CODE07Attention.md

README.md

transformer_components.py

Transformer 架构

本系列视频将系统性地讲解 Transformer 架构的核心原理及其在 LLM 中的关键技术实现。从 Transformer 的基础结构入手，逐步深入 Tokenizer 分词算法、Embedding 向量化技术、Attention 注意力机制及其多种变种算法，并专门探讨 Transformer 在长序列处理上的架构优化方案，最后详解大模型训练与推理中的关键参数设置。为深入理解与应用前沿 AI 技术奠定坚实基础。

内容大纲

建议优先下载 PDF 版本，PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲	小节	链接	状态
Transformer 架构	01 Transformer 基础结构	PPT, 视频, 文章	✅
Transformer 架构	02 大模型 Tokenizer 算法	PPT, 视频, 文章	✅
Transformer 架构	03 大模型 Embedding 算法	PPT, 视频, 文章	✅
Transformer 架构	04 Attention 注意力机制	PPT, 视频, 文章	✅
Transformer 架构	05 Attention 变种算法	PPT, 视频, 文章	✅
Transformer 架构	06 Transformer 长序列架构	PPT, 视频, 文章	✅
Transformer 架构	07 大模型参数设置	PPT, 视频, 文章	✅
💖	🌟	💖
代码实践	01 搭建迷你 Transformer	Markdown, Jupyter	✅
代码实践	02 从零实现 Transformer 训练	Markdown, Jupyter	✅
代码实践	03 实战 Transformer 机器翻译	Markdown, Jupyter	✅
代码实践	04 手把手实现核心机制 Sinusoidal 编码	Markdown, Jupyter	✅
代码实践	05 手把手实现核心机制 BPE 分词算法	Markdown, Jupyter	✅
代码实践	06 手把手实现核心机制 Embedding 词嵌入	Markdown, Jupyter	✅
代码实践	07 深入注意力机制 MHA、MQA、GQA、MLA	Markdown, Jupyter	✅

内容大纲

备注

文字课程内容正在一节节补充更新，每晚会抽空继续更新正在 AI Infra ，希望您多多鼓励和参与进来！！！

文字课程开源在 AI Infra，系列视频托管B 站和油管，PPT 开源在github，欢迎引用！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

Transformer 架构

内容大纲

内容大纲

备注

FilesExpand file tree

01Basic

Directory actions

More options

Directory actions

More options

Latest commit

History

01Basic

Folders and files

parent directory

README.md

Transformer 架构

内容大纲

内容大纲

备注