白底封面写着 GaussianDWM 和驾驶世界模型副标题。

架构图左侧展示多视角图像进入 3D Gaussian 表示。

视频画面显示高斯特征散点和道路图像投影。

视频画面展示两张道路图和 grounding 文本结果。

图中左侧是规划和区域描述，中间是道路场景理解，右侧是热力图生成。

结果截图中 GaussianDWM 行被高亮，平均指标为 59.23。

结果截图显示 Ours 在多个 shift 设置下取得较低 FID 和 FVD。

视频画面是多行道路帧，对比左偏和右偏渲染结果。

视频画面按 Day、Night、Rainy、Turn Left 分行展示未来道路帧。

视频画面按 Cloudy、Rainy、Night 分行展示未来帧。

案例图展示道路图像、文本查询、回答和生成深度序列。

案例图展示道路问答、目标框和 RGB-D 生成结果。

机器之心 · 2026.06.14 · 9 stories · 12:16

机器之心 AI News Digest

机器之心 2026.06.14 digest with 9 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

0:00 - 1:28

01. Claude Fable 5四日惊魂 Source
文章复盘了 Claude Fable 5 从 6 月 9 日发布到 6 月 12 日被美国政府出口管制要求下线的四天过程。
1:28 - 2:54

02. Fable 5被特朗普禁止幕后黑手曝光？Karpathy可能也用不了了 Source
文章聚焦 Fable 5 和 Mythos 5 被禁的幕后线索，称亚马逊向美国政府提交研究材料，声称其研究人员越狱了 Fable 5。
2:55 - 4:34

03. DeepMind震撼报告：四条通往超级人工智能之路 Source
文章介绍 Google DeepMind 研究者发布的《From AGI to ASI》报告，讨论人类水平 AGI 之后走向超级人工智能的可能路径。
4:34 - 6:05

04. 员工骂高管、限token使用量、扎克伯格承认犯错：Meta内部炸锅了 Source
文章报道 Meta 内部 AI 使用从鼓励员工大量使用，转向追踪、限额和预算控制。
6:06 - 7:47

05. AI圈懵了：一家巴西市政IT公司开源的大模型，杀进了全球第一梯队 Source
文章介绍 Rio 3.5 Open 397B，一个由里约热内卢市政府旗下市政 IT 公司 IplanRIO 开发并开源的前沿通用模型。
7:48 - 9:51

06. CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成 Source
文章介绍 CVPR 2026 工作 GaussianDWM，它用语言增强的 3D Gaussian 场景表示统一自动驾驶场景理解和多模态生成。
9:52 - 10:37

07. PEFT方法评测不能只看下游分：通用能力损失也该被量化 Source
文章介绍 PEFT-Arena，一个从稳定性和可塑性权衡角度评测参数高效微调方法的基准与分析框架。
10:38 - 11:25

08. 图片越糊越危险？西湖大学发现多模态大模型「攻击舒适区」 Source
文章介绍西湖大学 AGI Lab 的研究，发现有害文本被渲染成低清、模糊或带噪图像后，多模态大模型可能进入攻击舒适区。
11:25 - 12:16

09. BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本 Source
文章介绍 BudgetMem，一个面向 runtime agent memory 的 query-aware budget-tier routing 框架。