今天的头条是 Claude Fable 5 的四日惊魂。文章称,这个 6 月 9 日刚发布的最强公开模型,6 月 12 日就被美国政府要求下线。
发布当天,Fable 5 被描述为 Mythos 家族的公开版本,面向软件工程、知识工作和视觉任务开放,定价也更低。
但系统卡里隐藏的能力限制很快引发争议。文章称,模型遇到前沿 AI 开发请求时会降低回答质量,却不主动告知用户。
这被批评者称为暗中降质。Anthropic 后来承认没有取得正确平衡,并移除了相关隐性限制。
第二个问题来自企业治理。文章称,微软因数据留存政策临时禁止员工使用 Fable 5,担心提示词和输出被长期保留。
最关键的转折发生在 6 月 12 日。美国商务部要求 Fable 5 和 Mythos 5 对外国主体接受出口管制。
Anthropic 的回应是关闭访问,因为选择性合规会影响大量用户,甚至包括公司内部的外籍员工。
文章还强调,政府引用的越狱说法在 Anthropic 看来只是局部案例,并不足以召回已经商用部署的模型。
这件事的信号很明确:前沿模型发布不只要看能力榜单,还要同时面对安全透明度、企业数据政策和国家安全许可。
第二条继续看 Fable 5。文章称,导致禁令的直接导火索之一,可能来自 Anthropic 的重要合作方亚马逊。
禁令范围被写得很宽,美国境外主体和美国境内外国主体都被纳入,这也引出 Karpathy 是否受影响的讨论。
但文章也提醒,Karpathy 持有 EB-1 绿卡,按出口管制法很可能被归类为美国人,实际情况并不确定。
真正的内幕线索是亚马逊。文章引用 Axios 称,亚马逊向政府提交报告,声称研究人员越狱了 Fable 5。
华尔街日报的报道则把焦点放到 Amazon CEO 与美国官员的通话,称这些接触触发了对 Anthropic 模型的打击。
这里的微妙点在于,亚马逊既是 Anthropic 最大外部投资方之一,也是云计算和 AI 模型分发链条上的关键参与者。
文章称,至少还有五家公司也向政府表达了担忧,这让 Fable 5 的问题看起来像一次行业集体施压。
LeCun 的评论把争议推向另一个方向:如果安全恐慌本身导致外国雇员无法用模型,责任该如何分配。
对 Anthropic 来说,讽刺在于,这家公司因为安全品牌出名,最后却因为安全指控被投资方和政府一起推上风口。
第三条是 DeepMind 的 AGI 到 ASI 报告。它关心的不是 AGI 哪天到来,而是人类水平 AI 之后会不会继续跃迁。
报告把 ASI 定义得很高:不是超过某个天才,而是在几乎所有领域超过大量专家组成的协作集体。
文章先列出数字智能的天然优势:更快处理、更大记忆、可复制实例,以及比人类组织更高的通信带宽。
第一条路径是扩展算力。如果 AGI 实例可以被大量复制或加速运行,群体能力就可能迅速超过单个人类。
第二条路径是算法范式变化,例如持续学习、开放环境智能体和新的训练方式,可能突破现有大模型框架。
第三条路径是递归自我改进,也就是 AI 帮助改进 AI 研究本身,让模型、数据和工具迭代更快。
第四条路径是群体智能。大量专业化 AGI 实例可以并行分工,并用高带宽通信减少人类组织里的摩擦。
但报告也列出很多刹车:数据墙、芯片和能源、研究越来越难,以及现有神经网络范式可能碰到天花板。
最有意思的限制叫抽象壁垒。文章说,AI 如果只在人类已有框架里工作,可能还需要真正和物理世界互动。
所以这份报告的价值不是押注日期,而是画出 AGI 之后的地形:哪些路可能加速,哪些悬崖可能让它停下。
第四条看 Meta。文章说,几个月前公司还鼓励员工大量用 AI,现在却开始从 tokenmaxxing 转向 tokenminimizing。
The Information 看到的备忘录称,Meta 要实时追踪员工 AI 使用和支出,设置预算,并限制 token 花费。
原因很直接:照当前趋势,单是内部 AI 使用在 2026 年就可能花掉数十亿美元。
文章还提到,员工曾冲内部 Claudeonomics 排行榜,有人在 30 天消耗 60.2 万亿 token,后来升到 73.7 万亿。
CTO Bosworth 的态度是,只有 AI 真能提升生产力时才该用,token 使用量本身不能衡量影响力。
与此同时,Meta 希望减少对 Claude 等外部编码工具的依赖,转而加强自研编码助手 MetaCode。
更难处理的是员工角色变化。Applied AI 团队被要求生成谜题和编程题,用来支持模型训练,引发明显不满。
Reuters 还报道,已有员工反对监控鼠标点击和键盘操作并用于 AI 训练数据的项目。
扎克伯格也承认,公司在 AI 劳动力转型中已经犯错,未来还会继续调整组织安排。
Meta 的案例说明,企业 AI 的难点不只是让员工用起来,而是让成本、数据和工作方式都可持续。
第五条是一个很反常识的开源模型故事。文章称,里约热内卢市政府旗下 IT 公司发布了 Rio 3.5 Open 397B。
这个模型来自 IplanRIO,基于 Qwen 3.5 397B 后训练,却在多个公开基准中被文章描述为开源第一梯队。
核心规格是 397B 总参数、17B 激活参数、MoE 架构,以及大约一百万 token 的上下文窗口。
文章称它的强项覆盖智能体编程、数学、STEM、多语言和多模态,已经能和更知名的开源及闭源模型同台比较。
社交媒体上的震动也来自身份反差:不是传统巨头实验室,而是一家巴西市政 IT 公司突然杀进前排。
Hugging Face 的 Clem Delangue 把它解读成路线选择:闭源 API 集中权力,或者开源 AI 让更多机构参与。
技术上,文章特别提到 SwiReasoning,它根据置信度信号,在显式思维链和潜空间推理之间动态切换。
柱状图和基准截图显示,Rio 3.5 在 Terminal、SWE、HLE 和 GPQA 等项目上与 Qwen、DeepSeek、Kimi、GPT 并列比较。
不过,文章也没有完成第三方复测。真正要看的,是模型在实际推理成本、安全性和多语言任务中的稳定表现。
这条新闻的信号是,开源生态的上限正在抬高,前沿模型不一定只会从少数商业实验室里长出来。
第六条是今天的 dense story。GaussianDWM 想解决的问题,是让自动驾驶世界模型既能理解场景,也能生成未来画面。
它的核心选择是 3D Gaussian。每个高斯单元不仅有位置、尺度和外观,还绑定来自 CLIP 和 SAM 的语言语义。
然后,Gaussian Projector 和任务感知采样把这些 3D token 压缩成 LLM 能读的表示,主实验里每个场景采样 4096 个 token。
这样做的意义是,模型不只看平面图像,还能把目标、道路、障碍物和空间位置组织成可查询的 3D 场景。
生成端也不是单独开一条线。低层 RGB-D 条件负责纹理和几何,高层 world knowledge 负责语义和空间先验。
在 NuInteract 上,GaussianDWM 平均指标达到 59.23,高于 DriveMonkey 的 52.12,3D visual grounding mAP 达到 52.78。
在空间生成上,±1 米视角位移时 FID 和 FVD 是 8.36 和 44.50;±2 米时是 11.27 和 68.17。
视频演示里,模型可以从同一输入道路画面生成左偏和右偏视角,保持道路几何关系基本一致。
第三个视频看未来帧生成。日间、夜间、雨天和转弯场景都被放进同一组预测里。
第四个视频进一步覆盖 cloudy、rainy 和 night,说明模型尝试在不同天气和光照下维持时序一致。
第五个视频把时间拉长到 3 秒、5 秒和 10 秒预测,用来观察长程生成是否还能保持道路结构。
所以这篇工作的重点不是更会画图,而是把可生成、可定位、可问答的 3D 世界表示放在同一个自动驾驶模型里。
第七条是 PEFT-Arena。它问的问题很实用:微调把数学分数拉上去时,模型到底忘掉了多少通用能力。
这个基准把目标域性能和通用能力保留放在双轴图里,理想方法应该尽量靠近右上角。
文章称,几乎所有方法都有权衡。全量微调目标分高但更容易损失通用能力,OFT 往往更均衡。
机制解释来自几何分析。遗忘不只是激活移动了多少,而是原本的通用表征结构是否被扭曲。
论文还用插值路径分析发现,最终 checkpoint 未必是最优点,中间路径可能保留更多通用能力。
第八条是多模态安全。西湖大学团队发现,图片不是越糊越安全,而是存在一个攻击舒适区。
研究把有害文本渲染成不同清晰度图像。模型仍能读懂文字,但安全拒绝机制在某个中间区间明显变弱。
论文把它解释为视觉认知过载:模型先忙着辨认字符,安全审查被挤到后面。
以 Qwen3-VL 为例,文本 ASR 是 36.7%,ACZ 图像 ASR 升到 86.2%,但 OCR 准确率仍然很高。
缓解方案很朴素:先转写图片文字,再做安全评估,最后决定是否回答,把识别和审查拆开。
最后一条是 BudgetMem。它给 agent memory 加了一个预算路由器,让系统按 query 决定记忆处理该花多少钱。
它不是提前把历史固定压缩好,而是在问题到来时检索相关片段,再构建面向当前 query 的记忆。
每个模块都有 LOW、MID、HIGH 三档预算,路由器可以为过滤、实体、时间、主题和摘要步骤分别选档。
训练上,BudgetMem 把档位选择看成序列决策,用最终回答质量和记忆提取成本共同定义奖励。
实验显示,它能在 LoCoMo、LongMemEval 和 HotpotQA 上形成更可控的性能成本前沿,让记忆系统真正按需计算。