自动驾驶(Autonomous Driving)是指通过传感器感知、环境理解、行为预测和路径规划等技术,使车辆能够在无人干预或最小干预的情况下自主行驶的系统。现代自动驾驶系统深度依赖人工智能技术,包括计算机视觉、深度学习、强化学习和世界模型等。随着端到端学习和世界模型的发展,自动驾驶正从模块化架构向统一感知-预测-规划的端到端架构演进。
Multi-Stream LLMs: Unblocking Language Models with Parallel Streams of Thoughts, Inputs and Outputs(2026-05-12):语言模型能力的持续改进已经释放了它们作为自主代理驱动程序的广泛用途,例如在编码或计算机使用应用程序中。
Shields to Guarantee Probabilistic Safety in MDPs(2026-05-11):屏蔽是一种重要的基于模型的技术,可确保自主代理的安全。
DataMaster: Towards Autonomous Data Engineering for Machine Learning(2026-05-11):随着模型系列、训练方法和计算预算变得越来越标准化,机器学习系统的进一步收益越来越依赖于数据。
Algorithmic bottlenecks in evolution: Genetic code, symbolic language, and the Great Filter hypothesis(2026-05-06):大过滤假说提出,能够进行星际旅行的技术社会的出现取决于少数异常困难且极不可能的步骤。
Chapter 2: Geometry of the Fitness Surface and Trajectory Dynamics of Replicator Systems(2026-05-06):我们研究复制系统平均适应度表面的几何形状及其与进化轨迹动力学的关系。
ActCam: Zero-Shot Joint Camera and 3D Motion Control for Video Generation(2026-05-07):对于艺术应用,视频生成需要对表演和摄影进行精细控制,即演员的动作和摄像机轨迹。
StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction(2026-05-07):大型语言模型(LLM)越来越多地用作交互式代理,但优化它们以进行长期决策仍然很困难,因为当前的方法很大程度上纯粹是反应性的,这削弱了扩展轨迹上的探索和信用分配。
Verifier-Backed Hard Problem Generation for Mathematical Reasoning(2026-05-07):大型语言模型(LLM)展示了解决科学和数学问题的强大能力,但它们难以产生有效的、具有挑战性的和新颖的问题——这是推进 LLM 培训和实现自主科学研究的重要组成部分。
Laplacian Frequency Interaction Network for Rural Thematic Road Extraction(2026-05-04):农村专题路网建设旨在从农机运动轨迹图像中提取拓扑道路结构。
Zhou et al. (2026). HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation. arXiv:2604.28196v1
HERMES++ 针对自动驾驶领域的一个核心矛盾展开:现有驾驶世界模型主要关注未来场景生成,忽视了全面的 3D 场景理解;而 LLM 虽然具备强大的推理能力,却缺乏预测未来几何演化的能力。这造成了语义解释与物理模拟之间的显著鸿沟。
方法:HERMES++ 在单一框架内集成了 3D 场景理解与未来几何预测。核心设计包括:
发现:HERMES++ 在未来点云预测和 3D 场景理解任务中均超越了各自领域的专业方法,验证了统一架构相比独立模型的协同效应。
HERMES++ 的工作代表了自动驾驶从模块化向统一架构演进的最新进展:
基于 HERMES++ 及现有文献,以下问题仍待解决: