机器之心 AI NEWS DIGEST
2026 06 19
STORY 01 / 8

GLM-5.2全球免费6小时,马斯克点赞,HuggingFace掏钱

01-01
黑底发布卡写有 FREE GLM 5.2 和黄色笑脸图标。
01-02
Hugging Face 相关社交截图展示 GLM-5.2 Free 和推理提供商信息。
01-03
社交对话截图中 Elon Musk 回复 Probably Q1,智谱相关账号回复 won't take that long。
01-04
Marc Andreessen 转发截图讨论 GLM-5.2 及 AI 模型竞争。
01-05
Artificial Analysis Intelligence 柱状图中 GLM-5.2 Thinking 被红箭头标注。
01-06
Agent Arena Leaderboard 截图中 GLM-5.2(Max) 被黄色标注。
STORY 02 / 8

Claude Code史诗级更新,突破终端,把工作实时变成网页看板

02-01
橙色 Claude Code 封面图用几何图形和连线表现工具主题。
02-02
官方 slide 写有 Claude Code now supports artifacts,并说明可预览实时交互网页。
02-03
演示画面写有 Code that's worth showing,右下角有终端代码窗口。
STORY 03 / 8

超越SONIC!人形机器人「小脑」的GPT时刻来了,还有史上最大动捕数据,整整20亿帧

03-01
标题卡写有全球首个人形机器人通用小脑 GPT 基础模型 AstraBrain-WBC 0.5。
03-02
穿白色连帽衫的人形机器人坐在书架前,手里拿着篮球。
动图展示人类和白色人形机器人同步做侧向运动。
03-04
数据卡写有 2 万小时人类数据,旁边有人类动作采集画面。
03-05
折线图显示数据规模从 2M 到 2B 时 zero-shot MPJPE 下降。
动图展示人踢向机器人,机器人被踢后保持平衡。
03-07
架构图展示 500 experts、MLP、RL 和 causal transformer 等模块。
03-08
饼图比较 PHUMA、Motion Million、Inhouse、Lafan1、AMASS 数据占比。
03-09
成功率柱状图显示 history length 从 4 到 64 时成功率约 88.4 到 90.6。可提取数据:4=88.4,8=89.7,16=90.1,32=90.4,64=90.6。
03-10
方法对比表显示 Humanoid-GPT 使用 Transformer,支持 agile、zero-shot,并标注 2.0B frames。
03-11
模型开源卡写有 AstraBrain-WBC 0.5 和 Humanoid-GPT。
STORY 04 / 8

马斯克说明年Q1,唐杰说用不了那么久,谁在闷头做中国的Mythos?

04-01
橙色封面图用线条人脸和节点形状表现世界模型或交互系统主题。
04-02
Anthropic 社交截图说明 Fable 5 和 Mythos 5 访问受政府指令影响。
04-03
黑底社交截图展示 Musk 回复 Probably Q1,以及中国账号回复 won't take that long。
04-04
Hugging Face 页面截图展示与 Macaron / GLM 等相关的模型列表。
04-05
YouTube 视频截图展示 GLM-5.2 Coding 相关 benchmark 柱状图。
04-06
GitHub 仓库截图展示 Megatron-GLM5.2 项目文件列表。
STORY 05 / 8

大逆转:传投资者抱团从Meta原价赎回Manus,135亿元

05-01
白底图片展示黑色 Manus 手势标识。
05-02
手机屏幕显示 Manus 标识,背景是模糊的 Meta 标志。
05-03
白底图片展示黑色 Manus 手势标识。
STORY 06 / 8

ICML 2026 Spotlight | AI隐私训练时,那个最难控制的「阀门」能自动调节吗?

06-01
论文标题页显示 SlaClip: Gradient Norm Slacks can be Indicator for Adaptive Clipping in DP-SGD。
06-02
流程图展示原始梯度、梯度裁剪、聚合、加噪和训练步骤。
06-03
SlaClip 流程图展示参数更新、集合、Slack Indicator 和 clip value 调整。
06-04
结果表比较 CIFAR-10、MNIST、P-MNIST、IMDB、Nano 数据集上的 Vanilla-Clip、Auto-S、AutoClip 和 SlaClip。
06-05
热力图展示不同 clipping value 与 learning rate 下多种方法的颜色分布。
STORY 07 / 8

LLM终于学会推公式了!博世x清华推出FunctionEvolve:LLM-SRBench提升3.6倍,AI-Feynman满分

07-01
论文标题页显示 FunctionEvolve: Structure-Guided Symbolic Regression with LLMs。
07-02
方法总览图展示结构感知父表达式选择、LLM 生成器、局部 AST refinement 和 LLM mutator。
07-03
三栏图展示公式空间爆炸、复杂公式拟合训练数据、复杂公式在新输入上失败。
07-04
结果表比较 LLM-SR、OpenEvolve、PiT-PO 和 FunctionEvolve。可提取数据:FunctionEvolve Claude Opus 4.6 Acc@0.1 113
07-05
消融表展示 Full、w/o All、w/o Generator、w/o Selector 等设置下的 SA@50、Acc@0.1 和测试 NMSE。
STORY 08 / 8

ICML 2026|Agent通讯的「运营商」哪家强?UIUC团队发布ProtocolBench

08-01
论文标题页显示 ProtocolBench: Which LLM MultiAgent Protocol to Choose?
08-02
示意图展示 Google、OpenAI、Anthropic、Agora 等协议和 ProtocolBench / ProtocolRouter。
08-03
中文表格列出评估维度,包括任务成功与输出质量、端到端延迟、消息交互开销、资源消耗和故障鲁棒性。
08-04
四个场景图展示 GAIA Document QA、Safety Tech、Streaming Queue 和 Fail-Storm Recovery。
08-05
ProtocolRouter 架构图展示场景描述、协议特征、最终决策和前后端智能体通信。
GLM-5.2 这条新闻用免费开放六小时制造了很强的传播点。
Hugging Face 相关截图显示,平台和推理提供商也参与了这波扩散。
Musk 讨论中国模型追上 Fable 的时间,智谱相关账号回复不会太久。
Marc Andreessen 的转发进一步放大了模型发布的国际关注。
智能指数图和 Agent Arena 榜单,是原文用来支撑性能讨论的证据。
这条新闻的关键,是免费策略、榜单表现和社区讨论形成了同一波声量。
Claude Code 的更新重点,是把终端里的工作变成实时网页产物。
官方 slide 明确写着 Claude Code now supports artifacts。
它强调可以从完整会话上下文生成可分享的交互式网页。
演示图里的 Code that's worth showing,说明输出不再只是命令行文本。
这对开发者工作流的意义,是 coding agent 更容易进入评审、演示和协作环节。
银河通用这条新闻,把人形机器人的小脑模型称作 GPT 时刻。
封面里的白色机器人和球类道具,说明它面向的是身体控制而不是聊天。
动图展示人类和机器人同步运动,这是模仿学习和运动迁移的直观证据。
数据卡强调 2 万小时人类数据,是原文讲大规模动捕的关键数字。
数据规模曲线显示,训练帧数扩大后 zero-shot 误差持续下降。
机器人被踢后保持平衡的动图,用来展示鲁棒控制能力。
架构图把专家模型、Transformer 和强化学习放进同一套控制框架。
饼图展示数据来源构成,Motion Million 占主要部分。
成功率图说明历史长度增加时,模型执行成功率略有提高。
方法对比表把 Humanoid-GPT 标成使用 Transformer 和 2.0B 帧的数据路线。
结尾的开源卡显示模型已经公开,后续重点会是复现和真实任务检验。
这篇文章讨论的不是单个模型,而是中国团队能否做出自己的 Mythos。
Anthropic 截图提供了 Fable 和 Mythos 被限制访问的背景。
Musk 认为 Fable class 可能要到明年一季度,中国账号则回应不会太久。
Hugging Face 模型列表说明相关模型和开源生态已经在快速堆叠。
YouTube benchmark 和雷达图被原文用来支撑 GLM 能力讨论。
GitHub 仓库截图则把故事落到可查看的模型工程文件上。
Manus 这条新闻关注资本结构大逆转,而不是产品功能更新。
标题称投资者从 Meta 原价赎回 Manus,金额达到 135 亿元。
如果报道属实,这意味着 Manus 的控制权和融资叙事会重新调整。
但这类交易必须等官方文件验证,不能只按传闻做结论。
这篇 ICML Spotlight 论文关注隐私训练里最难调的裁剪阀门。
DP-SGD 的流程包括梯度裁剪、聚合、加噪和训练。
SlaClip 的想法,是用梯度范数 slack 作为自适应裁剪信号。
结果表把 SlaClip 和多种固定或自适应方法放在多个数据集上比较。
热力图说明裁剪值和学习率组合会显著影响隐私训练表现。
FunctionEvolve 这篇论文关注 LLM 能不能更系统地推公式。
方法图显示它不是直接让模型猜答案,而是把生成、选择、变异和局部优化拆开。
公式空间挑战图解释了为什么简单暴力搜索很快会失效。
结果表里,FunctionEvolve 在多个模型后端上超过 LLM-SR 和 OpenEvolve。
消融表说明生成器、选择器和结构优化器都对最终表现有贡献。
ProtocolBench 这篇论文问的是,多 Agent 通信协议到底该选哪一种。
协议示意图把 A2A、ANP、MCP、ACP 和 Agora 放在同一张图里。
评估表说明它不只看成功率,还看延迟、消息成本、资源和鲁棒性。
四个任务场景覆盖文档问答、安全技术、流式队列和故障恢复。
ProtocolRouter 架构图展示系统如何根据场景描述和协议特征做选择。
机器之心 AI News Digest

机器之心 · 2026.06.19 · 8 stories · 4:51

机器之心 AI News Digest

机器之心 2026.06.19 digest with 8 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 0:35
    01. GLM-5.2全球免费6小时,马斯克点赞,HuggingFace掏钱 Source
    文章报道 GLM-5.2 全球免费开放 6 小时,并引发 Musk、Hugging Face 和 AI 社区讨论。
  2. 0:35 - 1:05
    02. Claude Code史诗级更新,突破终端,把工作实时变成网页看板 Source
    文章报道 Claude Code 支持 artifacts,把终端里的工作实时变成可预览、可分享的网页看板。
  3. 1:06 - 2:13
    03. 超越SONIC!人形机器人「小脑」的GPT时刻来了,还有史上最大动捕数据,整整20亿帧 Source
    文章报道 Galbot / 银河通用发布人形机器人小脑基础模型 AstraBrain-WBC 0.
  4. 2:14 - 2:49
    04. 马斯克说明年Q1,唐杰说用不了那么久,谁在闷头做中国的Mythos? Source
    文章围绕 Fable / Mythos、GLM 和中国团队追赶世界模型能力展开,讨论国内谁在做类似方向。
  5. 2:50 - 3:12
    05. 大逆转:传投资者抱团从Meta原价赎回Manus,135亿元 Source
    文章报道 Manus 投资者据称抱团从 Meta 原价赎回,交易规模被写作 135 亿元。
  6. 3:13 - 3:44
    06. ICML 2026 Spotlight | AI隐私训练时,那个最难控制的「阀门」能自动调节吗? Source
    文章介绍 ICML Spotlight 论文 SlaClip,研究差分隐私 SGD 中梯度范数裁剪阈值能否自动调节。
  7. 3:44 - 4:17
    07. LLM终于学会推公式了!博世x清华推出FunctionEvolve:LLM-SRBench提升3.6倍,AI-Feynman满分 Source
    文章介绍 Bosch 与清华提出 FunctionEvolve,用结构引导的 LLM 符号回归提升公式发现能力。
  8. 4:18 - 4:51
    08. ICML 2026|Agent通讯的「运营商」哪家强?UIUC团队发布ProtocolBench Source
    文章介绍 UIUC 团队发布 ProtocolBench,比较多智能体通信协议,并提出 ProtocolRouter。