机器之心 · 2026.06.04 · 12 stories · 11:27

机器之心 AI News Digest

机器之心 2026.06.04 digest with 12 source-grounded stories, bilingual captions, synchronized narration, and source media panels.

Stories

0:00 - 0:57

01. 李飞飞讲清楚世界模型 Source
文章整理李飞飞与 World Labs 团队对世界模型的定义，强调当前领域混用概念，需要区分视觉生成、可交互仿真、物理引擎和能支持行动的世界表示。
0:58 - 2:44

02. 谷歌 I/O 最大赢家不是谷歌 Source
文章从谷歌 I/O 的 Gemini Omni Flash 发布讲起，随后用多段 Seedance 2.
2:44 - 3:38

03. Vibe Working 轮到白领了 Source
文章从 Codex 并入 ChatGPT 讲到 Kimi Work，认为 Coding Agent 的能力正在迁移到报告、文件、数据分析和工作流自动化等白领日常任务。
3:38 - 4:36

04. Gemma 4 12B 跑进笔记本 Source
文章称，谷歌在 Gemma 下载量突破 1.
4:36 - 5:35

05. Token 经济学定义 Agent 资源分配 Source
文章介绍浙大与阿里云等机构的综述 Token Economics for LLM Agents，把 Token 重新定义为生产要素、交换媒介和记账单位，研究 Agent 系统中的计算、协作和治理成本。
5:35 - 6:08

06. Agent 知不知道自己花了多少 Source
文章介绍 BAGEN，把预算意识定义为智能体独立能力，并用 rollout-replay 协议评测模型是否知道执行任务时将消耗多少内部和外部预算。
6:08 - 7:05

07. NeurIPS AI 检测拒稿争议 Source
文章报道 NeurIPS 2026 Position Paper Track 使用闭源 AI 文本检测器 Pangram 辅助 desk rejection，引发投稿人对循环论证、验证数据和程序公正的质疑。
7:05 - 8:04

08. 把论文改写成 Agent 原生研究包 Source
文章介绍 The Last Human-Written Paper: Agent-Native Research Artifacts，37 位学者提出把面向人类阅读的 PDF 论文，改造成 AI 能直接执行、检查和复现实验的研究包。
8:04 - 8:37

09. OmniVTG 补齐开放世界语义盲区 Source
文章介绍北大和华为团队的 OmniVTG 数据集与 Self-Correction CoT 训练范式，用于开放世界视频时序定位，目标是缓解罕见概念语义盲区。
8:38 - 9:35

10. 小鹏谈自动驾驶基座模型部署 Source
文章称，小鹏第三次登上 CVPR 演讲台，在具身智能基座模型部署研讨会上讨论自动驾驶下一步不是 VLA 与世界模型二选一，而是要面向量产场景组合落地。
9:36 - 10:31

11. MMDesign 让抗体发现可编程 Source
文章称，分子之心发布 AI 生物药从头设计平台 MMDesign，用生成-过滤策略和 MMFold 结构预测，在十多个高价值靶点上以低实验通量完成纳米抗体设计验证。
10:31 - 11:27

12. 打字正在变成古老技艺 Source
文章把 Vibe Coding、Vibe Working 和语音输入连接起来，认为当 AI 承担更多生成和执行工作时，键盘输入可能不再是知识工作的默认入口。