STORY 02 / 5
今天的头条来自 Anthropic:文章称,美国政府把 Fable 5 和 Mythos 5 放进出口管制框架,禁止外国主体访问。
这不是简单的海外订阅限制,而是把前沿模型访问权视作类似高端芯片和敏感软件的受控技术。
文章称,美国商务部长致信 Dario Amodei,要求 Fable 5 和 Mythos 5 的出口、再出口和境内转让都接受许可。
管制范围被写得很宽:美国境外任何地点,以及美国境内的外国政府、企业和个人,都被纳入限制。
报道给出的触发背景,是政府听说另一家公司声称越狱了 Mythos,于是担心模型能力外溢带来国家安全风险。
文章还提到,特朗普此前要求领先 AI 开发者在发布最强模型前,自愿交给政府做网络安全测试。
这意味着模型公司可能要面对逐项许可、访问身份审查,以及违规后的经济处罚和民事处罚。
更微妙的是,文章把 Anthropic 描述成同时被认为太危险不适合政府使用,也太危险不适合外国使用。
对行业来说,真正的变量是模型访问权会不会从产品问题升级成国家安全许可问题。
后续要看的,是政府正式文件、Anthropic 的合规执行,以及其他前沿模型公司是否被纳入同样框架。
第二条仍然围绕 Fable 5:文章称,它在最严 AI 编程基准 ProgramBench 上二百题全部拒答,却仍被榜单排到第一。
ProgramBench 测的是从编译后的二进制文件重建源代码,这类任务触发了 Fable 5 的网络安全分类器。
文章称,Fable 5 不是做错了二百题,而是一道不答,把二进制重建当成了敏感逆向工程。
尴尬的是,它在其他编程基准上表现很强,文章称 SWE-Bench Pro 得分达到 80.3%。
于是 ProgramBench 榜单综合其他基准表现,仍把 Fable 5 放在榜首,引发“交白卷也能第一”的质疑。
外界争议点很明确:如果一个模型拒绝任务,评测应该记零分,还是把它当成缺测处理。
文章还把问题追到护栏架构:内部探针先扫描激活,一旦触发警报,再交给独立 LLM 分类器裁决。
这种机制可以降低滥用风险,但也会把正常教学、安全研究和底层工程任务一起挡掉。
另一份 ALE 评测里,文章称 Fable 5 得分 22.0%,但平均每道题成本约 15.70 美元。
这件事的核心不是某个榜单的笑话,而是前沿模型越强,护栏、拒答和评测解释就越会影响真实可用性。
第三条是今天技术含量最高的一组:World Labs 同日发布首批三篇论文,全部指向从 2D 数据走向 3D 和 4D 世界建模。
文章说,这三项研究共享一个目标:借用成熟 2D 生成模型的先验,降低三维内容生成的数据和训练门槛。
第一篇 World Tracing 处理单张图像,它不是只估计可见表面深度,而是沿每个像素射线预测多层三维坐标。
这种多层 XYZ 表示把第零层锚定在可见表面,再让更深层补全被遮挡的隐藏几何。
在长视频里,World Tracing 展示了从单张照片恢复物体和室内场景几何的例子。
第二篇 Modality Forcing 问的是,文生图模型能不能同时理解颜色、文字和深度。
它的关键做法,是给 RGB 和深度两种模态设置独立的扩散噪声时间步,让同一个模型在生成和感知之间切换。
短片里可以看到,模型从文本提示生成 RGB 与深度结果,也能围绕已知图像或深度做条件生成。
第三篇 Flex4DHuman 把问题推进到时间维度:从普通单目视频中重建可以合成新视角的动态人体。
方法基于 Wan 2.1 微调,把位置编码扩展到五个轴,让视频扩散模型直接感知相机之间的相对位姿。
视频中,单个参考视角被转换成同步多视角输出,再进入重建管线形成可渲染的 4D 资产。
文章称,这项方法在 DNA-Rendering 上相对对照方法 PSNR 提升约 9.3 dB,在 ActorsHQ 零样本测试上提升约 3.4 dB。
更重要的是,文章把三篇论文连成一条路线:用日常图像和视频数据,训练更强的可探索世界模型。
同一天,联合创始人 Christoph Lassner 也宣布离开日常运营,但文章称他会继续以顾问身份支持公司。
所以这不是单篇论文新闻,而是 World Labs 从产品演示走向公开学术路线的一次集中亮相。
后续要看的,是这些预印本能否转化为稳定工具,以及它们能否真正扩大 3D 与 4D 数据的来源。
HumanEgo 这篇论文的看点很直接:文章称,三十分钟人类第一人称视频,就能零样本教会机器人做双臂操作。
它不依赖机器人遥操作数据,而是让人戴 Aria 眼镜采集日常演示,再转成可训练的交互表示。
核心不是模仿人的手,而是把手和物体之间的相对位姿、抓取状态和交互几何编码成 ICT。
实验部分,文章称 HumanEgo 在四个真实双手任务上达到 92.5% 平均成功率,并显著超过遥操作基线。
真正重要的是数据接口:如果普通第一人称视频可复用,机器人学习就不再完全被实验室硬件绑定。
最后一条是 AI 安全论文:文章称,语义缓存本来是为了省推理成本,却可能被设计成响应劫持入口。
港科大和复旦团队提出 CacheAttack,研究对象是 LLM 服务中把语义向量当缓存键的机制。
攻击思路是构造对抗后缀,让恶意请求和受害者的良性请求在嵌入空间里发生键碰撞。
文章称,在 GPTCache 上,两个攻击变体分别取得 86.9% 和 83.1% 的命中率。
更危险的是 agent 场景:一旦错误缓存被复用,结果可能不是一句错话,而是错误工具调用。