覆盖 Transformer、RAG、上下文系统、预训练对齐、Agent 与最新 Harness 工程六大主线。 每篇论文配独立精读:摘要 / 方法 / 实验逐段精译,新手友好。
现代大模型的地基。从自注意力机制到 BERT/GPT/LLaMA/Mamba。理解一切的起点。
02让大模型用上外部知识库:从 RAG 原论文到 Self-RAG、CRAG、综述。
03长上下文与记忆管理:稀疏注意力、位置外推、流式生成、外部记忆。
04训练全流程:缩放定律、RLHF、LoRA/QLoRA、CoT。从能力到对齐到推理。
05让大模型行动起来:ReAct / Toolformer / 反思 / 思维树 / 终身学习。
062026 最新视角:决定 Agent 可靠性的是执行外壳(harness)而非模型本身。
按顺序读完这 15 篇 ⭐⭐⭐ 论文,你将建立大模型完整知识地图。