世界模型

定义

世界模型是能够学习环境动态规律、预测未来状态的计算模型。在 AI 领域，世界模型旨在让智能体通过内部模拟理解世界运行规律，用于规划、决策和生成。本库中有 1 篇论文推动了驾驶场景世界模型的前沿。

关键文献与发现

Routers Learn the Geometry of Their Experts: Geometric Coupling in Sparse Mixture-of-Experts（2026-05-12）：稀疏专家混合 (SMoE) 模型可以有效地扩展语言模型，但训练它们仍然具有挑战性，因为路由可能会崩溃到少数专家身上，而辅助负载平衡损失可能会减少专业化。
LongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced Colleagues（2026-05-12）：长期记忆对于专门网络环境中的代理至关重要，其中的成功取决于对界面可供性、状态动态、工作流程和重复出现的故障模式的回忆。
Variational Inference for Lévy Process-Driven SDEs via Neural Tilting（2026-05-11）：对极端事件和重尾现象进行建模对于在金融、气候科学和安全关键型人工智能等领域构建可靠的预测系统至关重要。
Algorithmic bottlenecks in evolution: Genetic code, symbolic language, and the Great Filter hypothesis（2026-05-06）：大过滤假说提出，能够进行星际旅行的技术社会的出现取决于少数异常困难且极不可能的步骤。
A process-based dynamic occupancy model to study range dynamics under non-equilibrium conditions（2026-05-06）：在对分布进行建模时未能考虑分散和连通性等生态过程可能会导致对环境驱动因素的有偏见的推断并降低预测性能。
Direct From Darwin: Deriving Advanced Optimizers From Evolutionary First Principles（2026-05-06）：进化计算长期以来一直致力于提供高性能优化工具以及达尔文进化论的严格科学模拟。
Chapter 2: Geometry of the Fitness Surface and Trajectory Dynamics of Replicator Systems（2026-05-06）：我们研究复制系统平均适应度表面的几何形状及其与进化轨迹动力学的关系。
Towards a unified framework for multiple stable states in ecological systems（2026-05-07）：多重稳定状态——相同环境条件下两种或多种不同生态配置的共存——引起了生态学的持续关注，但该领域仍然缺乏连接生态机制和动力学模型的统一框架。
Higher-order interactions in ecology can be hidden in plain sight（2026-05-07）：高阶相互作用越来越被认为是生态动力学的关键组成部分。
Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key（2026-05-07）：强化学习 (RL) 已被应用于改进大型语言模型 (LLM) 推理，但由于缺乏受控、可扩展的环境，对训练如何随任务难度进行扩展的系统研究受到了阻碍。
Continual Knowledge Updating in LLM Systems: Learning Through Multi-Timescale Memory Dynamics（2026-05-06）：法学硕士接受一次培训，然后部署到一个永不停息变化的世界。

HERMES++：统一理解与生成的驾驶世界模型

HERMES++ 针对驾驶世界模型的核心矛盾：现有方法要么侧重场景生成（如视频扩散模型），要么侧重语义理解（如 LLM 推理），两者在同一框架中难以兼顾。

统一方案：将 3D 场景理解和未来几何预测集成在一个框架内。通过四个关键设计实现统一：

BEV 表示将多视角空间信息整合到 LLM 兼容的结构中
LLM 增强的世界查询促进理解分支的知识迁移
当前到未来的链接机制弥合时间差距，根据语义上下文调节几何演化
联合几何优化策略结合显式几何约束与隐式正则化

关键结果：在多个基准上同时实现强大的未来点云预测和 3D 场景理解性能，均优于各自领域的专用方法。模型和代码已开源。

📄 查看论文

研究趋势

HERMES++ 代表了世界模型从”纯生成”向”理解+生成统一”的转变：

传统路径：生成逼真的未来帧（如 Sora 风格的视频生成）
新路径：同时理解环境动态和预测未来状态（HERMES++）
关键洞察：语义理解和几何预测不是互斥的，可以相互增强

开放问题：统一框架能否扩展到更复杂的城市场景？计算效率如何进一步提升？

世界模型

定义

关键文献与发现

HERMES++：统一理解与生成的驾驶世界模型

研究趋势

相关论文

相关概念