智能体

定义

智能体(AI Agent)是指能够感知环境、进行推理、做出决策并采取行动以实现特定目标的自主系统。基于大语言模型的智能体将 LLM 作为核心”大脑”,通过工具使用、规划和记忆机制与外部环境交互。本库中有 8 篇论文从单智能体能力、多智能体协作、训练安全等角度研究了这一方向。

关键文献与发现

多智能体协作框架

CAMEL 提出”角色扮演”范式引导两个 AI agent 自主协作。通过 inception prompting 技术,两个 agent 分别扮演”AI 妈妈”和”AI 婴儿”等角色,在没有人类干预的情况下完成复杂任务。核心发现是精心设计的提示可以激发 agent 之间的自发协作行为。

📄 查看论文

ChatDev 模拟软件公司,CEO(目标设定)→ 程序员/测试员(执行),通过”chat chain”机制将复杂任务分解为多轮对话,并提出”communicative dehallucination”技术减少多 agent 间的幻觉传播。

📄 查看论文

MetaGPT 将标准操作流程(SOP)编码为 prompt 序列,项目经理设定目标 → 开发者执行,采用流水线范式分配角色,避免了简单链式调用的级联幻觉问题。

📄 查看论文

AgentVerse 提出可动态调整的多 agent 协作框架,实验表明多 agent 组的性能显著优于单个 agent,并发现协作中会自发产生领导力、分工等涌现社会行为。

📄 查看论文

AutoGen 是微软开源的通用多 agent 对话框架,支持灵活定义 agent 交互模式,包括 supervisor-worker 模式,为构建各种多 agent 应用提供了基础设施。

📄 查看论文

MAD(多代理辩论) 发现单 agent 自反思存在”思维退化”问题——一旦形成初始判断就难以改变。多 agent 辩论通过发散思维有效克服此问题,在常识翻译和反直觉推理上显著优于单 agent。

📄 查看论文

智能体训练与安全

Synthetic Computers 构建大规模合成计算机环境,通过双代理框架(目标代理 + 工作代理)生成长期生产力模拟数据,每次模拟平均 2000+ 回合,产生丰富的体验式学习信号。

📄 查看论文

Exploration Hacking 从安全角度揭示了 LLM 智能体在 RL 训练中可能学会策略性操纵探索行为,对智能体的安全训练提出警示。

📄 查看论文

研究趋势

单 agent vs 多 agent

系统 架构 核心优势
CAMEL 角色扮演双 agent 自发协作
ChatDev CEO→程序员/测试员 流程化分工
MetaGPT SOP 编码流水线 避免级联幻觉
AgentVerse 动态多 agent 组 涌现社会行为
AutoGen 通用对话框架 灵活可配置
MAD 多 agent 辩论 克服思维退化
Synthetic Computers 目标+工作双代理 大规模训练数据

关键洞察:多 agent 协作在任务完成率、输出质量、错误减少方面显著优于单 agent。核心优势在于分工降低认知负荷、交叉验证减少幻觉、辩论促进发散思维。

从单 agent 到多 agent 的演进

相关论文

相关概念