精选 AI Agent 开发的核心资源(只推荐最重要的!)
- ✅ 只收录 Agent 开发直接相关的资源
- ✅ 只推荐面试会考、项目会用的
- ✅ 每个资源都标注适合场景和学习难度
🔗 需要更全面的资源?
查看作者的另一个项目:Awesome-Awesome-LLM
(涵盖 LLM 全栈的 200+ Awesome 系列资源)
⭐ 本文档持续更新,欢迎贡献!
详细框架对比见:Agent 开发框架推荐
- 链接:https://github.com/langchain-ai/langgraph
- Stars:15k+
- 简介:LangChain 团队出品,用图结构构建弹性 Agent
- 特点:状态管理、可视化工作流、灵活编排
- 适合场景:复杂 Agent 工作流、Multi-Agent 系统
- 学习难度:⭐⭐⭐⭐
- AgentGuide 教程:LangGraph 核心概念
- 链接:https://github.com/microsoft/autogen
- Stars:30k+
- 简介:微软开源的多智能体对话框架
- 特点:Multi-Agent 协作、可视化 Studio、代码执行
- 适合场景:多智能体系统、角色扮演型 Agent
- 学习难度:⭐⭐⭐
- 官网:https://autogen-studio.com/
- 链接:https://github.com/joaomdmoura/crewAI
- Stars:20k+
- 简介:角色扮演型自主 AI Agent 框架
- 特点:角色定义、任务分工、简单易用
- 适合场景:明确角色分工的协作系统
- 学习难度:⭐⭐⭐
- 链接:https://github.com/geekan/MetaGPT
- Stars:40k+
- 简介:软件公司多角色协作框架
- 特点:模拟软件公司流程(PM、工程师、测试)
- 适合场景:软件开发流程自动化
- 学习难度:⭐⭐⭐
- 链接:https://github.com/openai/swarm
- 简介:OpenAI 官方的轻量级 Multi-Agent 框架
- 特点:极简设计,适合学习
- 适合场景:学习 Agent 基础概念
- 学习难度:⭐⭐
- 链接:https://github.com/Significant-Gravitas/AutoGPT
- Stars:160k+
- 简介:早期的自主 Agent 框架
- 特点:完全自主,目标驱动
- 学习难度:⭐⭐⭐
- 链接:https://github.com/microsoft/agent-framework
- 简介:微软官方框架,支持 Python 和 .NET
- 特点:企业级、跨语言
- 适合场景:企业级应用
- 学习难度:⭐⭐⭐⭐
- 链接:https://github.com/camel-ai/owl
- 简介:优化工作流学习框架
- 特点:任务自动化、工作流优化
- 学习难度:⭐⭐⭐
- 链接:https://github.com/emcie-co/parlant
- 简介:确保 Agent 指令遵循的框架,不再依赖 LLM"可能"遵循,而是"确保"必定遵循
- 核心技术:ARQs(Attentive Reasoning Queries - 注意力推理查询)
- 特点:
- 通过预定义推理步骤确保指令遵循
- 在 87 个测试场景中成功率达 90.2%(高于 CoT 的 86.05%)
- 针对性预防领域常见失效模式
- 适合场景:有明确领域指南的场景(客户服务、医疗咨询)
- 学习难度:⭐⭐⭐
- 关键资源:
- 链接:https://github.com/agentscope-ai/agentscope
- 简介:面向 Agent 的模块化编程框架
- 特点:
- 模块化设计,易于维护和扩展
- 灵活的集成能力
- 企业级支持(阿里云等背书)
- 详细的文档和示例
- 适合场景:模块化 Agent 系统、企业级应用
- 学习难度:⭐⭐⭐
- 链接:https://github.com/OpenBMB/ToolBench
- 简介:工具学习基准测试
- 包含:16000+ 真实 API、工具调用数据集
- 适合场景:工具调用评估和测试
- 链接:https://github.com/ShishirPatil/gorilla
- 简介:大模型 API 调用优化
- 特点:专注于提升工具调用准确性
- 适合场景:提升 Agent 工具调用能力
- 链接:https://github.com/OpenBMB/ToolLLM
- 简介:工具学习的 LLM 训练
- 适合场景:训练专门的工具调用模型
详细记忆系统设计见:Agent 记忆系统
- 链接:https://github.com/mem0ai/mem0
- Stars:20k+
- 简介:轻量级 Agent 记忆模块
- 特点:简单易用、支持多种后端
- 适合场景:快速集成记忆功能
- 注意:社区反馈有稳定性问题,使用前需验证
- 链接:https://github.com/cpacker/MemGPT
- 简介:长期记忆管理系统
- 特点:虚拟内存机制
- 适合场景:需要长期记忆的 Agent
- 链接:https://github.com/getzep/zep
- 简介:长期记忆存储
- 特点:企业级、可扩展
- 适合场景:生产环境的记忆管理
- 文档:https://python.langchain.com/docs/modules/memory/
- 简介:LangChain 内置记忆模块
- 特点:多种记忆类型
- 适合场景:LangChain 生态内使用
- 链接:https://github.com/mnotgod96/AppAgent
- 简介:移动应用 Agent
- 特点:自主操作手机应用
- 适合场景:移动端自动化
- 链接:https://github.com/OSU-NLP-Group/SeeAct
- 简介:视觉理解 + 网页操作
- 特点:GPT-4V 驱动
- 适合场景:多模态 Web Agent
- 链接:https://github.com/princeton-nlp/WebShop
- 简介:在线购物 Agent 基准测试
- 适合场景:电商场景的 Agent 评估
- 链接:https://github.com/OSU-NLP-Group/Mind2Web
- 简介:网页任务理解数据集
- 适合场景:Web Agent 训练和评估
- 链接:https://webarena.dev/
- 简介:Web Agent 评估基准
- 适合场景:综合评估 Web Agent 能力
| Benchmark | 简介 | 链接 |
|---|---|---|
| GAIA | 通用 AI Agent 评估,测试真实任务完成能力 | 论文 |
| AgentBench | Agent 综合能力评估,涵盖多种任务类型 | GitHub |
| WebArena | Web Agent 评估,真实网站交互测试 | 官网 |
| ToolBench | 工具使用评估,测试 API 调用能力 | GitHub |
- 论文:Synergizing Reasoning and Acting in Language Models
- 必读原因:Agent 架构基础,推理与行动的结合
- 核心思想:将推理(Reasoning)和行动(Acting)交织进行
- 发表会议:ICLR 2023
- 论文:Reflexion: Language Agents with Verbal Reinforcement Learning
- 必读原因:自我反思机制,让 Agent 从错误中学习
- 核心思想:通过语言反馈进行自我改进
- 发表会议:NeurIPS 2023
- 论文:Toolformer: Language Models Can Teach Themselves to Use Tools
- 必读原因:工具调用的开创性工作
- 核心思想:LLM 自学使用外部工具
- 论文:HuggingGPT: Solving AI Tasks with ChatGPT and its Friends
- 必读原因:大模型作为控制器调度其他模型
- 核心思想:LLM 作为任务规划器和模型调度器
- 论文:Attentive Reasoning Queries: A Systematic Method for Optimizing Instruction-Following in Large Language Models
- 代码:https://github.com/emcie-co/parlant/tree/arqs-a-systematic-method-for-optimizing-instruction-following-in-llms
- 必读原因:系统性方法确保 LLM 指令遵循
- 核心思想:
- 通过领域专用推理步骤引导 LLM
- 使用结构化 JSON 模式的目标查询
- 三阶段流程:引导 ARQ → 响应生成 → 响应验证
- 实验效果:在 87 个测试场景中成功率达 90.2%(高于 CoT 的 86.05%)
- 适用场景:有明确领域指南、失效模式清晰的场景(客服、医疗)
- 文档:ai-agent-production-challenges.md
- 核心内容:基于 12+ 个生产级 Agent 的实战经验
- 关键点:误差累积、成本问题、工具工程、系统集成
- 适合人群:想要构建生产级 Agent 的开发者
- 必读原因:揭示 Agent 的数学局限性和工程最佳实践
- 链接:https://www.anthropic.com/engineering/building-effective-agents
- 核心观点:何时该用 Agent,何时不该用
- 重点内容:Agent 设计模式、工作流编排
- 必读原因:Claude 团队的实战经验总结
- 链接:https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf
- 核心内容:实用的 Agent 构建指南
- 必读原因:OpenAI 官方最佳实践
- 链接:https://github.com/ginobefun/agentic-design-patterns-cn
- 核心内容:Agent 设计模式详解
- 必读原因:系统性介绍各种 Agent 架构模式
- 链接:https://github.com/langchain-ai/rag-from-scratch
- 简介:从零开始学习 RAG
- 适合人群:想要深入理解 RAG 的开发者
- 链接:https://github.com/liaokongVFX/LangChain-Chinese-Getting-Started-Guide
- 简介:LangChain 中文入门指南
- 适合人群:中文开发者快速上手
- 链接:https://github.com/rasbt/LLMs-from-scratch
- 简介:从零构建大语言模型
- 适合人群:想要深入理解 LLM 原理的开发者
- Agent 开发框架对比 - 详细的框架选型指南
- Agent 记忆系统设计 - 记忆模块实现方案
- RAG 资源大全 - RAG 技术栈完整资源
- AI 开发工具箱 - 开发工具和平台推荐
🙏 欢迎贡献:如果你发现好的 Agent 相关资源,欢迎提 PR!
- 资源必须与 Agent 开发直接相关
- 提供清晰的简介和使用场景
- 标注学习难度(⭐~⭐⭐⭐⭐⭐)
- 优先推荐面试会考、项目会用的资源
本文档采用 CC BY-SA 4.0 协议。
💡 提示:本文档专注于 Agent 开发的核心资源。如需更全面的 LLM 资源,请访问 Awesome-Awesome-LLM。
⭐ Star 支持:如果这个资源对你有帮助,欢迎给项目点个 Star!