机器之心 AI NEWS DIGEST
2026 06 18
STORY 01 / 10

天工3.1 重磅发布:上线 Skywork Design 与 Dynamic Workflows,给 AI 一张画布和一支军团

01-01
白底发布卡写有“重磅推出 天工设计智能体”,右侧列出多个设计模型标签。
01-02
表格列出官网落地、App/Web App 原型、资料设计、参考图规划等场景和产出内容。
01-03
深色健身应用多屏界面展示课程库、进度、个人档案和第 14 天训练安排。
01-04
植物养护应用多屏界面展示植物识别、养护日历、记录和详情页。
01-05
旅行规划应用界面展示路线、图片卡片、地图式行程和粉色移动端页面。
01-06
白底发布卡写有“重磅推出 天工设计智能体”,右侧列出多个设计模型标签。
STORY 02 / 10

人形机器人不再「走走停停」:Current Robotics发布全身灵巧操作模型Curr-0

02-01
人形机器人正面站立,双手握持黑色物体,背景是室内家居环境。
动图展示机器人在桌面前自主移动,左下角小窗显示手部近景。
动图展示机器人用手操作桌面设备和板状物体。
动图展示机器人站上平台并处理桌面上的多个物体。
02-05
多宫格图片展示多种室内和实验场景下的人形机器人操作数据。
02-06
人形机器人正面站立,双手握持黑色物体,背景是室内家居环境。
STORY 03 / 10

GPT‑5.4+化学智能体,OpenAI让AI自主优化药物反应,同步上线生命科学基准LifeSciBench

03-01
封面图用大脑、烧瓶、分子和实验台表现 AI 与化学实验连接。
03-02
实验室机械移液设备正在处理多孔板样品。
03-03
论文标题页写有 TEMPO improves generality and decreases oxidative deboronation。
03-04
柱状图展示不同底物的 normalized yield ratio,最高柱标注 18.3x。
03-05
LifeSciBench 任务图展示基因组、分子、图像、PDF、表格和网页输入进入专家评审。
03-06
绿色柱状图比较 GPT-5.4、Gemini、GPT-4.5、Grok 等模型的总分。
STORY 04 / 10

比英伟达早,比李飞飞强,大晓Kairos原生一体化世界模型定义物理AI新路线

04-01
ACE 标识机器人站在家居场景中,手臂伸向旁边的人手。
04-02
Kairos 发布 slide 展示 RoboTwin、LIBERO-plus、WorldBenchmark Robot、DreamGen 等榜单条形图。
04-03
模型架构图展示视频编码、空间-动作对齐、动作预测和未来生成视频模块。
源视频展示 ACE 机器人在厨房环境中浇花、开冰箱、取食材和倒入碗中。
源视频展示 ACE 机器人在厨房环境中浇花、开冰箱、取食材和倒入碗中。
源视频展示 ACE 机器人在厨房环境中浇花、开冰箱、取食材和倒入碗中。
STORY 05 / 10

RAG新SOTA,还在5亿条数据上跑进秒级,只有它了

05-01
深色表格按 chunk、SAG event、entities 三列展示事件和实体抽取示例。
05-02
流程图展示上传离线语料、构建索引、事件关系和图存储。
05-03
SAG 架构图展示实体抽取、事件抽取、语义阈值过滤和 Top-K 查询流程。
05-04
多跳数据集结果表比较 Simple Baselines、Large Embedding Models、Graph-based Methods 和 SAG。可提取数据:HippoRAG 2 Av
05-05
MuSiQue 表格比较 SAG 与 HippoRAG 2 在 R@1、R@2、R@5、R@10 上的结果。可提取数据:SAG R@1 36.4,R@2 64.6,R@5 81.7,R@10
05-06
产品页面截图用红框标出证据文本、表格结果和引用区域。
05-07
图谱视图展示大量粉色和蓝色节点及其关系连接。
STORY 06 / 10

DeepSeek识图模式全量上线,却认不出自家老板梁文锋

06-01
官方社交截图写有 Vision is now live on web and app,并展示开始图片对话入口。
06-02
DeepSeek 蓝色封面图展示 deepseek 标识。
06-03
移动端截图展示梁文锋照片和模型回答结果。
06-04
横向图片展示多个手写中文姓名片段。
06-05
移动端截图展示识别几个字的问答结果。
06-06
移动端截图展示钢琴键图片和模型给出的音乐内容分析。
06-07
白底问答截图展示钢琴键图片和关于调式、和弦的回答。
STORY 07 / 10

九章云极发布AI工厂技术体系:以三大范式重构重绘AI效能曲线

07-01
发布现场大屏写有 Alaya NeW Cloud 3.0、AI 工厂和 Training Factory / Inference Factory 架构。
STORY 08 / 10

ARR达到3亿美金,Liblib完成近3亿美金融资,估值超20亿美金

08-01
LibTV 导演台封面展示影视角色画面,并写有多人物、多机位视角、复杂分镜一键搞定。
08-02
黑底融资卡写有 EVOKEN 演语完成近 3 亿美元 B+ 轮融资。
08-03
作品库截图展示多部 AI 生成视频或影视项目缩略图。
08-04
社交媒体截图展示用户用 LibTV 生成分镜和视频素材。
08-05
深色创作界面展示多个素材节点和底部工具栏。
08-06
访谈视频截图显示创始人坐在麦克风前接受采访。
STORY 09 / 10

用了10年,奥特曼终于等到了他想要的人

09-01
Noam Shazeer 人物照片,头戴帽子,肩旁有香蕉玩偶。
09-02
Noam Shazeer 推文称自己将加入 OpenAI。
09-03
Sam Altman 转推称从 OpenAI 早期就想和 Noam 合作。
09-04
Mark Chen 欢迎推文称 Noam 将领导架构研究。
09-05
Google Scholar 页面展示 Noam Shazeer 论文和引用趋势。
09-06
履历截图列出 Gemini Co-lead、Character.AI CEO 和 Google 工程岗位经历。
STORY 10 / 10

ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮,Holi-Spatial打造400万级空间多模态数据集

10-01
论文标题页显示 Holi-Spatial: Evolving Video Streams into Holistic 3D Spatial Intelligence。
10-02
Holi-Spatial 海报图汇总 4M 标签、多模态任务、3D grounding 和空间推理指标。
10-03
三步数据飞轮图展示几何优化、图像层感知和场景级细化流程。
10-04
模型表比较 MMSI-Bench 和 MindCube,Qwen3-VL-8B + Ours 标注为 32.6 和 49.1。可提取数据:Qwen3-VL-8B + Ours MMSI-Ben
10-05
空间推理样例卡片展示室内图片、问题和答案解释。
昆仑万维这次把天工 3.1 的重点放在设计智能体和动态工作流上。
原文把 Skywork Design 描述成面向多种设计任务的一张 AI 画布。
健身应用样例展示了课程库、训练进度和个人数据看板。
植物养护样例说明它也想覆盖生活类垂直应用原型。
旅行规划界面则展示了从素材到路线安排的组合式输出。
这条新闻的核心,是国产通用模型正在向可复用工作流和应用生成推进。
Current Robotics 发布 Curr-0,原文称它让人形机器人不再只会走走停停。
第一个动图展示机器人在桌面场景中移动并准备操作物体。
第二个动图把重点放在手部操作和桌面设备交互上。
第三个动图显示机器人需要同时处理身体平衡、位置和物体交互。
多宫格数据图说明模型背后依赖大量真实场景采集。
这条新闻值得看,是因为全身操作正成为人形机器人竞争的下一层能力。
OpenAI 这篇报道把大模型和化学实验闭环放在一起讨论。
实验设备截图说明这里不是纯文本问答,而是面向真实实验流程。
论文标题指向 Chan-Lam 偶联反应中的氧化脱硼问题。
收益图显示部分底物条件下归一化收益比有明显提升。
LifeSciBench 则把生命科学任务扩展到分子、图像、文档和表格输入。
这条新闻的核心,是 AI Agent 正从写答案转向辅助设计实验。
大晓 Kairos 把自己定位成面向物理 AI 的原生一体化世界模型。
原文 slide 把 Kairos 放到多个机器人和世界模型榜单里比较。
架构图显示它把视频理解、空间动作对齐和未来动作预测连成一条链路。
视频开头展示机器人在厨房里识别环境,并开始执行端侧具身任务。
随后机器人拿起杯子给植物浇水,这是对物理动作和环境状态的连续控制。
后半段它打开冰箱、取出食材,并把薯片倒入碗中。
这条 RAG 新闻的关键词,是把 chunk、event 和 entities 组织成可查询结构。
流程图显示系统先上传语料,再构建索引和事件关系,最后进入图存储。
SAG 架构图进一步展示实体抽取、事件抽取和 Top-K 查询如何协同。
多跳数据集表里,SAG 在平均指标上高于 HippoRAG 2 等图方法。
MuSiQue 单表则把 R@1 到 R@10 的召回指标列得更清楚。
产品截图显示,这类系统最终要落到可追踪证据的问答界面里。
图谱视图说明,RAG 的竞争正在从召回文本片段转向构造可推理的关系网络。
DeepSeek 识图模式全量上线,官方截图显示网页和 App 都能开始图片对话。
但文章的看点不只是上线,而是它在一些具体识别任务上翻车。
人物识别示例里,模型对梁文锋照片给出长回答,却没有准确识别核心人物。
手写中文示例显示,它能给出解释,但对字形和姓名的判断并不稳。
另一个移动端截图把识别几个字的问答过程展示出来。
乐谱截图说明用户也会把模型当成通用视觉理解入口。
这条新闻提醒我们,多模态产品上线和稳定可靠之间还有距离。
九章云极这条新闻关注 AI 工厂技术体系,而不是单一模型发布。
大屏左侧写着 Training Factory,指向训练阶段的工程化流程。
右侧写着 Inference Factory,强调推理部署和企业服务能力。
文章的核心判断是,企业需要像生产线一样管理 AI 模型和智能体。
真正要验证的,是这套体系能否在客户场景中降低训练和推理成本。
Liblib 这条新闻把融资额、ARR 和 AI 视频产品放在同一条增长线上。
融资卡显示 EVOKEN 演语完成近三亿美元 B+ 轮融资。
作品库截图展示平台正在承载大量视频和角色内容。
创作界面和社交截图说明用户已经在做分镜、节点和视频流程。
深色界面里的多个节点,体现了 AI 视频工具正向工作台形态演进。
这条新闻真正值得看的是,AI 创作平台正在被资本按生产力工具定价。
OpenAI 人才新闻里,Noam Shazeer 的加入被原文放在很高位置。
Noam 自己发文确认将加入 OpenAI,并提到离开 Google 团队的决定。
Sam Altman 转推说,自己从 OpenAI 早期就想和他合作。
Mark Chen 的欢迎推文进一步指出,他会领导架构研究。
Scholar 页面和履历截图说明他的研究影响力和 Character.AI 背景。
这条新闻的重点,是基础模型团队的人才竞争仍在加速。
Holi-Spatial 这篇 ICML Oral 论文关注 3D 空间智能数据。
它的目标是把普通视频流演化成带 3D 关系和空间标注的数据集。
数据飞轮先做几何优化,再做图像层感知,最后做场景级细化。
结果表显示,加入 Holi-Spatial 后,空间理解基准得分有提升。
空间推理样例说明模型要回答物体位置、朝向和关系问题。
机器之心 AI News Digest

机器之心 · 2026.06.18 · 10 stories · 6:03

机器之心 AI News Digest

机器之心 2026.06.18 digest with 10 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 0:35
    01. 天工3.1 重磅发布:上线 Skywork Design 与 Dynamic Workflows,给 AI 一张画布和一支军团 Source
    文章报道昆仑万维发布天工 3.1,并把重点放在 Skywork Design 与 Dynamic Workflows 两个新能力上。
  2. 0:35 - 1:10
    02. 人形机器人不再「走走停停」:Current Robotics发布全身灵巧操作模型Curr-0 Source
    文章报道 Current Robotics 发布全身灵巧操作模型 Curr-0,强调人形机器人在移动和操作之间减少停顿。
  3. 1:11 - 1:44
    03. GPT‑5.4+化学智能体,OpenAI让AI自主优化药物反应,同步上线生命科学基准LifeSciBench Source
    文章称 OpenAI 展示化学智能体能力,用 GPT-5.
  4. 1:45 - 2:21
    04. 比英伟达早,比李飞飞强,大晓Kairos原生一体化世界模型定义物理AI新路线 Source
    文章报道大晓 Kairos 原生一体化世界模型,强调物理 AI 与端侧具身大脑路线。
  5. 2:21 - 3:10
    05. RAG新SOTA,还在5亿条数据上跑进秒级,只有它了 Source
    文章介绍一个新的 RAG / 图检索方案,称其在五亿条数据上达到秒级表现并刷新多跳问答指标。
  6. 3:10 - 3:53
    06. DeepSeek识图模式全量上线,却认不出自家老板梁文锋 Source
    文章报道 DeepSeek 识图模式全量上线,同时列举它识别梁文锋、乐谱和手写中文时的失败案例。
  7. 3:53 - 4:23
    07. 九章云极发布AI工厂技术体系:以三大范式重构重绘AI效能曲线 Source
    文章报道九章云极发布 AI 工厂技术体系,用训练工厂和推理工厂重构 AI 工程效率。
  8. 4:23 - 4:59
    08. ARR达到3亿美金,Liblib完成近3亿美金融资,估值超20亿美金 Source
    文章报道 Liblib ARR 达到 3 亿美元,并完成近 3 亿美元融资,估值超过 20 亿美元。
  9. 5:00 - 5:33
    09. 用了10年,奥特曼终于等到了他想要的人 Source
    文章报道 Noam Shazeer 加入 OpenAI,并引用 Sam Altman、Mark Chen 等社交媒体表态。
  10. 5:33 - 6:03
    10. ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮,Holi-Spatial打造400万级空间多模态数据集 Source
    文章介绍 ICML 2026 Oral 论文 Holi-Spatial,目标是把视频流转成整体 3D 空间智能数据。