让大模型行动起来:ReAct / Toolformer / 反思 / 思维树 / 终身学习。
论文架构、核心观点、创新点、实验设置、写作风格、图表亮点、新手阅读建议——尽在导读合集
推理+行动交替,Agent 范式基石
模型自主学会调用工具
通过反思自我改进
自我反馈迭代优化输出
LLM 作为控制器调度多模型
斯坦福小镇,多智能体社会模拟
思维树,搜索式推理
终身学习智能体 (Minecraft)
Agent 全景综述
模块化神经符号架构,工具调用先驱