STORY 01 / 10
STORY 03 / 10
STORY 05 / 10
STORY 09 / 10
昆仑万维这次把天工 3.1 的重点放在设计智能体和动态工作流上。
原文把 Skywork Design 描述成面向多种设计任务的一张 AI 画布。
健身应用样例展示了课程库、训练进度和个人数据看板。
旅行规划界面则展示了从素材到路线安排的组合式输出。
这条新闻的核心,是国产通用模型正在向可复用工作流和应用生成推进。
Current Robotics 发布 Curr-0,原文称它让人形机器人不再只会走走停停。
第一个动图展示机器人在桌面场景中移动并准备操作物体。
第三个动图显示机器人需要同时处理身体平衡、位置和物体交互。
这条新闻值得看,是因为全身操作正成为人形机器人竞争的下一层能力。
OpenAI 这篇报道把大模型和化学实验闭环放在一起讨论。
实验设备截图说明这里不是纯文本问答,而是面向真实实验流程。
论文标题指向 Chan-Lam 偶联反应中的氧化脱硼问题。
LifeSciBench 则把生命科学任务扩展到分子、图像、文档和表格输入。
这条新闻的核心,是 AI Agent 正从写答案转向辅助设计实验。
大晓 Kairos 把自己定位成面向物理 AI 的原生一体化世界模型。
原文 slide 把 Kairos 放到多个机器人和世界模型榜单里比较。
架构图显示它把视频理解、空间动作对齐和未来动作预测连成一条链路。
视频开头展示机器人在厨房里识别环境,并开始执行端侧具身任务。
随后机器人拿起杯子给植物浇水,这是对物理动作和环境状态的连续控制。
这条 RAG 新闻的关键词,是把 chunk、event 和 entities 组织成可查询结构。
流程图显示系统先上传语料,再构建索引和事件关系,最后进入图存储。
SAG 架构图进一步展示实体抽取、事件抽取和 Top-K 查询如何协同。
多跳数据集表里,SAG 在平均指标上高于 HippoRAG 2 等图方法。
MuSiQue 单表则把 R@1 到 R@10 的召回指标列得更清楚。
产品截图显示,这类系统最终要落到可追踪证据的问答界面里。
图谱视图说明,RAG 的竞争正在从召回文本片段转向构造可推理的关系网络。
DeepSeek 识图模式全量上线,官方截图显示网页和 App 都能开始图片对话。
但文章的看点不只是上线,而是它在一些具体识别任务上翻车。
人物识别示例里,模型对梁文锋照片给出长回答,却没有准确识别核心人物。
手写中文示例显示,它能给出解释,但对字形和姓名的判断并不稳。
这条新闻提醒我们,多模态产品上线和稳定可靠之间还有距离。
九章云极这条新闻关注 AI 工厂技术体系,而不是单一模型发布。
大屏左侧写着 Training Factory,指向训练阶段的工程化流程。
右侧写着 Inference Factory,强调推理部署和企业服务能力。
文章的核心判断是,企业需要像生产线一样管理 AI 模型和智能体。
真正要验证的,是这套体系能否在客户场景中降低训练和推理成本。
Liblib 这条新闻把融资额、ARR 和 AI 视频产品放在同一条增长线上。
融资卡显示 EVOKEN 演语完成近三亿美元 B+ 轮融资。
创作界面和社交截图说明用户已经在做分镜、节点和视频流程。
深色界面里的多个节点,体现了 AI 视频工具正向工作台形态演进。
这条新闻真正值得看的是,AI 创作平台正在被资本按生产力工具定价。
OpenAI 人才新闻里,Noam Shazeer 的加入被原文放在很高位置。
Noam 自己发文确认将加入 OpenAI,并提到离开 Google 团队的决定。
Sam Altman 转推说,自己从 OpenAI 早期就想和他合作。
Mark Chen 的欢迎推文进一步指出,他会领导架构研究。
Scholar 页面和履历截图说明他的研究影响力和 Character.AI 背景。
这条新闻的重点,是基础模型团队的人才竞争仍在加速。
Holi-Spatial 这篇 ICML Oral 论文关注 3D 空间智能数据。
它的目标是把普通视频流演化成带 3D 关系和空间标注的数据集。
数据飞轮先做几何优化,再做图像层感知,最后做场景级细化。
结果表显示,加入 Holi-Spatial 后,空间理解基准得分有提升。
空间推理样例说明模型要回答物体位置、朝向和关系问题。