智能体

定义

智能体（AI Agent）是指能够感知环境、进行推理、做出决策并采取行动以实现特定目标的自主系统。基于大语言模型的智能体将 LLM 作为核心”大脑”，通过工具使用、规划和记忆机制与外部环境交互。本库中有 8 篇论文从单智能体能力、多智能体协作、训练安全等角度研究了这一方向。

关键文献与发现

Multi-Stream LLMs: Unblocking Language Models with Parallel Streams of Thoughts, Inputs and Outputs（2026-05-12）：语言模型能力的持续改进已经释放了它们作为自主代理驱动程序的广泛用途，例如在编码或计算机使用应用程序中。
KV-Fold: One-Step KV-Cache Recurrence for Long-Context Inference（2026-05-12）：我们引入了 KV-Fold，这是一种简单的、免训练的长上下文推理协议，它将键值 (KV) 缓存视为序列块左折叠中的累加器。
MEME: Multi-entity & Evolving Memory Evaluation（2026-05-12）：基于 LLM 的代理越来越多地在持久环境中运行，它们必须在许多会话中存储、更新和推理信息。
LongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced Colleagues（2026-05-12）：长期记忆对于专门网络环境中的代理至关重要，其中的成功取决于对界面可供性、状态动态、工作流程和重复出现的故障模式的回忆。
Shields to Guarantee Probabilistic Safety in MDPs（2026-05-11）：屏蔽是一种重要的基于模型的技术，可确保自主代理的安全。
DataMaster: Towards Autonomous Data Engineering for Machine Learning（2026-05-11）：随着模型系列、训练方法和计算预算变得越来越标准化，机器学习系统的进一步收益越来越依赖于数据。
Engineering Robustness into Personal Agents with the AI Workflow Store（2026-05-11）：人工智能代理的主导范例是“即时”循环，其中代理综合计划并在几秒或几分钟内执行操作以响应用户提示。
Shepherd: A Runtime Substrate Empowering Meta-Agents with a Formalized Execution Trace（2026-05-11）：我们引入 Shepherd，这是一种函数式编程模型，它将目标代理上的元代理操作形式化为函数，并在精益中机械化核心操作。
The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents（2026-05-08）：上下文窗口扩展通常被视为法学硕士的直接能力升级，但我们发现它在多智能体社会困境中系统性地失败。
LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling（2026-05-08）：测试时间缩放（TTS）已成为通过在推理过程中分配额外计算来提高大型语言模型性能的有效方法。
Algorithmic bottlenecks in evolution: Genetic code, symbolic language, and the Great Filter hypothesis（2026-05-06）：大过滤假说提出，能够进行星际旅行的技术社会的出现取决于少数异常困难且极不可能的步骤。
A process-based dynamic occupancy model to study range dynamics under non-equilibrium conditions（2026-05-06）：在对分布进行建模时未能考虑分散和连通性等生态过程可能会导致对环境驱动因素的有偏见的推断并降低预测性能。
Towards a unified framework for multiple stable states in ecological systems（2026-05-07）：多重稳定状态——相同环境条件下两种或多种不同生态配置的共存——引起了生态学的持续关注，但该领域仍然缺乏连接生态机制和动力学模型的统一框架。
Superintelligent Retrieval Agent: The Next Frontier of Information Retrieval（2026-05-07）：检索增强代理越来越多地成为大型组织知识库的接口，但大多数仍然将检索视为黑匣子：它们发出探索性查询，检查返回的片段，并迭代地重新制定，直到出现有用的证据。
AI Co-Mathematician: Accelerating Mathematicians with Agentic AI（2026-05-07）：我们推出了 AI 联合数学家，这是数学家可以交互地利用 AI 代理进行开放式研究的工作台。
SoftSAE: Dynamic Top-K Selection for Adaptive Sparse Autoencoders（2026-05-07）：稀疏自动编码器 (SAE) 已成为机械可解释性的重要工具，有助于分析大型语言模型 (LLM) 和视觉变换器 (ViT) 中的内部表示。
Relit-LiVE: Relight Video by Jointly Learning Environment Video（2026-05-07）：最近的进展表明，大规模视频扩散模型可以重新用作神经渲染器，首先将视频分解为内在场景表示，然后在新颖的照明下执行前向渲染。
BAMI: Training-Free Bias Mitigation in GUI Grounding（2026-05-07）：GUI 接地是使 GUI 代理能够执行单击和拖动等任务的关键功能。
Cited but Not Verified: Parsing and Evaluating Source Attribution in LLM Deep Research Agents（2026-05-07）：大型语言模型 (LLM) 为深度研究代理提供支持，将来自数百个网络资源的信息合成为引用的报告，但这些引文无法得到可靠验证。
Recursive Agent Optimization（2026-05-07）：我们引入了递归代理优化（RAO），这是一种用于训练递归代理的强化学习方法：可以递归地生成子任务并将其委托给自身的新实例的代理。
StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction（2026-05-07）：大型语言模型（LLM）越来越多地用作交互式代理，但优化它们以进行长期决策仍然很困难，因为当前的方法很大程度上纯粹是反应性的，这削弱了扩展轨迹上的探索和信用分配。
Automatically Finding and Validating Unexpected Side-Effects of Interventions on Language Models（2026-05-06）：我们提出了一个自动化的对比评估流程，用于审核干预措施对大型语言模型的行为影响。
Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems（2026-05-05）：推理密集型检索旨在找出支持下游推理的证据，而不仅仅是匹配主题相似性。
Mitigating Misalignment Contagion by Steering with Implicit Traits（2026-05-04）：语言模型 (LM) 越来越多地用于高风险、多代理环境，在这些环境中，遵循指令和保持价值一致性至关重要。
FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents（2026-05-04）：Text-to-SQL over large analytical databases requires navigating complex schemas, resolving ambiguous queries, and grounding decisions in actual data.

多智能体协作框架

CAMEL 提出”角色扮演”范式引导两个 AI agent 自主协作。通过 inception prompting 技术，两个 agent 分别扮演”AI 妈妈”和”AI 婴儿”等角色，在没有人类干预的情况下完成复杂任务。核心发现是精心设计的提示可以激发 agent 之间的自发协作行为。

📄 查看论文

ChatDev 模拟软件公司，CEO（目标设定）→ 程序员/测试员（执行），通过”chat chain”机制将复杂任务分解为多轮对话，并提出”communicative dehallucination”技术减少多 agent 间的幻觉传播。

📄 查看论文

MetaGPT 将标准操作流程（SOP）编码为 prompt 序列，项目经理设定目标 → 开发者执行，采用流水线范式分配角色，避免了简单链式调用的级联幻觉问题。

📄 查看论文

AgentVerse 提出可动态调整的多 agent 协作框架，实验表明多 agent 组的性能显著优于单个 agent，并发现协作中会自发产生领导力、分工等涌现社会行为。

📄 查看论文

AutoGen 是微软开源的通用多 agent 对话框架，支持灵活定义 agent 交互模式，包括 supervisor-worker 模式，为构建各种多 agent 应用提供了基础设施。

📄 查看论文

MAD（多代理辩论） 发现单 agent 自反思存在”思维退化”问题——一旦形成初始判断就难以改变。多 agent 辩论通过发散思维有效克服此问题，在常识翻译和反直觉推理上显著优于单 agent。

📄 查看论文

智能体训练与安全

Synthetic Computers 构建大规模合成计算机环境，通过双代理框架（目标代理 + 工作代理）生成长期生产力模拟数据，每次模拟平均 2000+ 回合，产生丰富的体验式学习信号。

📄 查看论文

Exploration Hacking 从安全角度揭示了 LLM 智能体在 RL 训练中可能学会策略性操纵探索行为，对智能体的安全训练提出警示。

📄 查看论文

研究趋势

单 agent vs 多 agent

系统	架构	核心优势
CAMEL	角色扮演双 agent	自发协作
ChatDev	CEO→程序员/测试员	流程化分工
MetaGPT	SOP 编码流水线	避免级联幻觉
AgentVerse	动态多 agent 组	涌现社会行为
AutoGen	通用对话框架	灵活可配置
MAD	多 agent 辩论	克服思维退化
Synthetic Computers	目标+工作双代理	大规模训练数据

关键洞察：多 agent 协作在任务完成率、输出质量、错误减少方面显著优于单 agent。核心优势在于分工降低认知负荷、交叉验证减少幻觉、辩论促进发散思维。

从单 agent 到多 agent 的演进

单 agent 阶段（2023）：Toolformer、ReAct 展示单 agent 的工具使用和推理能力
双 agent 阶段（2023-2024）：CAMEL、ChatDev 证明角色分工的有效性
多 agent 系统（2024-2025）：AgentVerse、MetaGPT 探索涌现行为和 SOP 编码
大规模模拟（2025-2026）：Synthetic Computers 用双代理生成百万级训练环境

智能体

定义

关键文献与发现

多智能体协作框架

智能体训练与安全

研究趋势

单 agent vs 多 agent

从单 agent 到多 agent 的演进

相关论文

相关概念