机器之心 AI NEWS DIGEST
2026 06 16
STORY 01 / 13

DeepSeek首次融资落地:募集超500亿,估值超3300亿元

01-01
数字鲸鱼封面图表现 DeepSeek 主题。
01-02
外媒截图展示 DeepSeek 融资标题和标志照片。
01-03
数字鲸鱼在深色背景中发光。
01-04
DeepSeek 标志照片位于外媒报道页面下方。
01-05
蓝绿色线条构成鲸鱼轮廓。
01-06
外媒标题突出创纪录融资。
01-07
DeepSeek 主题封面作为结尾画面。
STORY 02 / 13

三连发!阿里发布首个具身大模型Qwen-Robot系列

02-01
机器人狗在室内靠近座椅和人腿。
02-02
三张雷达图对比 Qwen-Robot 三个模型的能力维度。
02-03
机器人在真实室内环境中执行移动或接近动作。
02-04
雷达图中包含 Qwen-RobotManip 的能力轮廓。
02-05
低矮机器人在家具旁边移动。
02-06
Qwen-RobotWorld 雷达图位于右侧。
02-07
机器人在真实房间中靠近座椅。
02-08
三类模型能力对比图作为结尾。
STORY 03 / 13

AI Scientists的下一站是社会科学:清华团队推出「硅基社会实验室」AgentSociety²

03-01
蓝色城市封面上写着 AgentSociety²。
03-02
图中把社会科学研究分成多种范式,并引入 Agentic Integration。
03-03
发展历程图列出 AgentSociety 系列的阶段。
03-04
左右两栏比较 AgentSociety-1 和 AgentSociety²。
03-05
工作流图围绕 AI 社会科学家列出研究步骤。
03-06
系统总览图展示多个章节和模块。
03-07
CodeGenRouter 图连接 agent、LLM、工具和环境模块。
03-08
图中列出 Micro、Meso、Macro 三类实验实践。
03-09
多组折线图和柱状图展示社会仿真结果。
03-10
研究范式图把 Agent 纳入理论和数据流程。
03-11
AgentSociety² 被标注为 Integrated Dual-Role Research Environment。
03-12
AgentSociety² 蓝色城市封面作为结尾。
STORY 04 / 13

年薪300万的前沿部署工程师,要被「录屏教学」替代了

04-01
AI 手指触碰电脑流程节点。
04-02
图中 FDE 把行业专家经验转成 AI 提示词。
录屏控件出现在桌面上,提示通过语音补充说明。
浏览器后台系统和表格界面被录屏学习。
04-05
图中左侧用户困扰于提示词,右侧用录屏教学更简单。
04-06
双架构图列出大模型和小模型的任务。
04-07
黑底图列出训练收敛、多重校验、规则约束。
深色业务系统界面中弹出信息录入面板。
画面叠加文字显示录入信息完毕,总用时 57 秒。
04-10
Agivar 官网页面展示产品入口和界面预览。
04-11
三层设计图强调规则约束和多重校验。
录屏控件和后台系统同框出现。
STORY 05 / 13

当AI Agent开始工作,安全该如何跟上?AgentDoG 1.5开源发布

05-01
二进制数字和电脑构成安全主题画面。
05-02
流程图展示任务、工具、观察和安全诊断模块。
05-03
图中展示训练型安全对齐和免训练系统护栏两条路径。
05-04
三维安全分类图列出多类 agent 风险。
05-05
表格列出三个 trajectory-level diagnostic task 数据集。
05-06
多组柱状图比较不同模型的安全诊断表现。
05-07
雷达图比较多种模型在安全维度上的轮廓。
05-08
AgentDoG 框架连接工具、环境和诊断输出。
05-09
AgentDoG 1.5 论文首页显示项目链接。
STORY 06 / 13

火山引擎发布Seedance 2.0 mini,API将于近期上线

06-01
表格比较主流视频生成模型价格。
06-02
价格表列出文生视频、图生视频和参考视频生视频价格。
06-03
Seedance 2.0 mini 行显示约 0.50 元/秒。
06-04
表格用多模型对比呈现批量生成成本。
06-05
多模型价格对比表作为结尾。
06-06
价格表提醒模型选择不只看单秒成本。
STORY 07 / 13

上线首月吸引 10 万开发者,AnySearch 为 Agent 解锁网页之外的世界

07-01
AnySearch 团队成员合影。
07-02
Answerability Score 柱状图比较多个任务。
07-03
AnySearch GitHub 仓库截图展示项目页面。
07-04
柱状图突出不同工具在答案可用性上的差异。
07-05
团队合影作为创业公司背景画面。
07-06
Answerability Score 图作为结尾。
STORY 08 / 13

Anthropic又摊上事了,夸大使用额度,被用户起诉

08-01
熊看窗外,画面写着 Token 又不够了。
08-02
WSJ 标题写着 Anthropic 因 200 美元 AI 计划限制被起诉。
08-03
Claude Code 定价指南列出 Max 5x 和 Max 20x。
08-04
社交媒体截图中出现 single session 和 usage limit 字样。
08-05
Claude 邮件说明 Agent SDK 计费调整暂缓。
08-06
文本截图讨论 Max 套餐用量倍率和限制。
08-07
WSJ 起诉报道截图作为结尾。
STORY 09 / 13

腾讯1.3亿入局!林俊旸新AI Lab首轮投后估值135亿,已寻求下一轮

09-01
林俊旸在公开活动中手持话筒。
09-02
履历截图展示阿里和研究经历。
09-03
Google Scholar 页面显示 Junyang Lin 的论文列表。
09-04
林俊旸照片作为人才竞争主题画面。
09-05
学术页面显示论文与引用信息。
STORY 10 / 13

大晓机器人完成天使+轮融资,多家知名财务和产业资本联袂投资,累计融资数亿美元

10-01
白色机器人正面站立。
STORY 11 / 13

Nature丨从10,747个分子到460亿个候选:AI正在把抗生素研发改写成一门可计算的实验科学

11-01
细菌、胶囊和分子结构组成抗生素主题图。
11-02
流程图展示从预测到实验验证的抗生素发现流程。
11-03
多面板图展示分子、蛋白和实验曲线。
11-04
SyntheMol 图展示模型训练、分子生成和体内外验证。
11-05
图中化学空间漏斗从十的十次方量级候选缩小到先导化合物。
11-06
实验图展示 AI 预测仍需实验数据验证。
STORY 12 / 13

视觉latent reasoning为什么不稳?这篇论文从特征空间找到了关键缺口

12-01
抽象机器结构旁散落图像碎片。
12-02
图中列出 Data Gap、Feature Gap 和 Model Gap。
12-03
HRBench4K 结果表中 Ours-GAP 行被高亮。
12-04
MathVista 结果表中 Ours-GAP Avg-R 为 53.97。
STORY 13 / 13

AI时代论文到底该怎么写?XtraGPT重新定义「AI学术写作」

13-01
黑底图上显示 XtraGPT 标志。
13-02
对比图展示直接生成论文和 XtraGPT 修订流程。
13-03
论文首页截图显示 XtraGPT 标题和项目链接。
13-04
表格列出六个 section-level revision criteria。
13-05
表格列出多个模型在 Title、Abstract、Overall 等指标上的分数。
今天机器之心头条,是 DeepSeek 首次对外融资落地,原文称募资超过五百亿元人民币。
报道给出的估值超过五百亿美元,折合约三千三百八十亿元人民币,是中国 AI 行业罕见的大额融资。
这轮交易结构很特殊,多数外部资金投向梁文锋管理的有限合伙企业,而不是直接投给 DeepSeek 本体。
原文称,为确保梁文锋的控制权,投资者资金有五年锁定期,并且通常不获得投票权。
例外是国家人工智能产业投资基金,它直接投资 DeepSeek,并享有公司投票权。
报道还称,梁文锋个人出资二百亿元,腾讯出资一百亿元,宁德时代、京东、网易和 IDG 也参与。
这说明 DeepSeek 的融资并不只是拿钱扩张,更是在筛选长期支持开源路线的资本。
需要注意的是,融资细节来自知情人士和媒体报道,具体协议与股权安排仍需公司层面确认。
第二条是阿里千问进入具身智能,发布 Qwen-Robot 系列。
这个系列包含三类模型:操作模型 Qwen-RobotManip、移动模型 Qwen-RobotNav,以及世界模型 Qwen-RobotWorld。
原文把它比作给机器人装上灵巧的手、认路的脚和会思考的大脑。
Qwen-RobotManip 聚焦 VLA 操作,用统一动作表征和相对位置操作,降低换硬件、换场景后的迁移成本。
Qwen-RobotNav 面向导航,目标是让机器人听懂自然语言并在陌生环境里移动。
Qwen-RobotWorld 则承担世界模型角色,让机器人理解物理规律和环境变化。
这条新闻的意义是,千问从语言和多模态能力继续向现实控制扩展。
后续要验证的是,它在不同硬件上的泛化、数据来源和实际任务成功率。
第三条看清华团队的 AgentSociety²,它把 AI Scientist 的方向推进到社会科学实验。
AgentSociety 的想法,是在计算机里构建可运行、可干预、可复现的硅基社会。
第一代系统已经能让大语言模型智能体进入大规模社会模拟,观察群体行为如何涌现。
第二代的重点,是从模拟器升级为一体化研究环境。
它把选题、文献检索、假设生成、实验设计、仿真配置、执行和分析放进一个闭环。
这意味着 AI 不只是生成研究建议,而是参与从问题到实验再到论文草稿的流程。
在工程上,CodeGenRouter 和环境模块负责把研究意图转成可运行的仿真实验。
原文展示的案例包括社交媒体动力学、城市生活、舆论极化和灾害移动等问题。
结果图说明,这类平台开始把社会科学中的干预和对照实验变成可重复的计算流程。
它的价值不是替代真实社会调查,而是让研究者先在可控环境中探索机制和假设。
如果平台成熟,AI Scientist 将不只做自然科学实验,也会进入复杂人类行为研究。
但模拟社会和真实社会之间仍有差距,智能体行为、数据偏差和伦理边界都需要持续验证。
第四条是桌面 Agent 产品 Agivar,核心主张是不用写复杂提示词,直接录屏教 AI 做事。
原文先指出一个行业痛点:Agent 会执行任务,但很多员工说不清自己的工作流程。
这催生了前沿部署工程师,把真实业务流程翻译成 AI 能执行的步骤。
Agivar 的选择是反过来,让用户演示流程,让 AI 从屏幕操作中学习。
在演示里,用户不需要把每个点击写成 prompt,而是像平常一样打开系统、选择数据、执行操作。
产品图把这个差异说得很直白:提示词像写说明书,录屏教学像带 AI 看一遍。
架构上,Agivar 被描述为大脑加小脑:大模型负责理解和规划,小模型负责界面识别、鼠标点击和键盘输入。
三层设计则强调训练收敛、多重校验和规则约束,用来减少执行中的不确定性。
第二段演示更接近真实工作:Agivar 在后台系统中打开输入面板,填写部门和金融中心等字段。
视频里还能看到,它记录录入耗时,并把流程作为可复用的自动化任务。
如果这类方法成熟,企业部署 Agent 的瓶颈会从写提示词,转向流程采集、验证和权限治理。
但风险也很明确:桌面录屏会接触内部系统、个人数据和业务权限,不能只看便利性。
这条新闻真正重要的地方,是它把教 AI 工作从语言描述推进到行为示范。
第五条是 Agent 安全。上海人工智能实验室发布 AgentDoG 1.5,面向 AI Agent 的安全诊断和在线护栏。
原文强调,Agent 风险不只在最终回答里,也会藏在工具调用、环境反馈、记忆和执行轨迹里。
AgentDoG 1.5 的核心,是从看输出转向看轨迹。
它既可以作为训练数据生成器,也可以作为运行时监控和告警框架。
分类体系把风险拆到执行设置、轨迹和现实影响等维度。
原文还给出三组数据集:ATBench、ATBench-Claw 和 ATBench-Codes。
评测图显示,不同模型和训练策略在风险识别、攻击场景和真实世界伤害维度上差异明显。
雷达图进一步说明,安全能力不是单一分数,而是多维能力组合。
对越来越多能读写文件、调用工具和操作代码的 Agent 来说,这类轨迹级护栏会变得更重要。
但开源框架是否能覆盖企业真实系统,还要看接入成本、误报率和运行时延迟。
第六条是火山引擎发布 Seedance 2.0 mini,定位为高性价比视频生成模型。
原文称,它将于近期上线 API,面向更广泛的视频创作和规模化生产。
按 720P 规格折算,Seedance 2.0 mini 单秒生成成本约为 0.5 元。
文章还说,相比 Seedance 2.0,它的生成成本降低约一半。
应用场景包括电商内容生产、营销素材批量生成、UGC 创作和特效玩法。
这条新闻的关键,是视频生成竞争开始从效果扩展到 API 成本和工业化可用性。
不过,价格优势还需要和实际可控性、稳定性、速度以及版权风险一起评估。
第七条是 AnySearch,一个面向 Agent 的搜索层服务。
文章认为,现在的搜索引擎主要为人的眼睛设计,而 Agent 需要更可靠、更可消化的信息输入。
AnySearch 上线首月吸引十万名开发者,累计搜索调用量突破四百万次。
原文称,它上线一周冲上 Agent 技能市场 Skills.sh 热榜第一。
产品逻辑不是只做 Top-K 相关性,而是服务后续推理链路。
这说明 Agent 竞争不只看模型,还要看信息获取层。
后续要验证的是,它在金融、法律、学术和威胁情报等专业数据源上的稳定性。
第八条是 Anthropic 被用户起诉,争议集中在 Claude Max 高价订阅的实际使用额度。
《华尔街日报》报道称,用户指控 Anthropic 夸大 Max 计划可用额度。
诉讼希望代表购买过 Max 5x 和 Max 20x 的用户,要求赔偿。
Max 20x 每月 200 美元,Max 5x 每月 100 美元,比 Pro 订阅贵很多。
用户抱怨的核心,是高价计划仍会在单次会话或短时间内触发额度限制。
另一边,Anthropic 也暂缓了 Agent SDK 计费调整,说明开发者计费压力已经被听见。
这条新闻不是单纯消费纠纷,而是 AI 订阅套餐如何描述真实算力资源的问题。
后续要看法院是否认定营销表述误导,以及 Anthropic 是否调整套餐透明度。
第九条是林俊旸新 AI Lab 融资,腾讯据称投入两千万美元。
原文称首轮融资总额达数亿美元,投后估值约二十亿美元。
高榕创投和红杉中国被报道为领投方,两家机构各投资一亿美元。
投资人押注他的关键背景,是他曾是阿里 Qwen 系列的重要技术负责人。
文章回顾称,他从达摩院多模态模型团队起步,后来接手通义千问系列。
这也说明中国大模型赛道的资本竞争,正在从公司品牌延伸到核心技术负责人。
不过,公司产品路线、模型发布节奏和融资细节仍需要后续公开信息确认。
第十条是大晓机器人完成天使加轮融资,原文称今年上半年累计融资数亿美元。
这轮资金将投入世界模型和软硬一体商业解决方案。
文章重点提到开悟世界模型 3.0,强调理解、生成和预测一体化。
落地场景包括智慧零售、安防巡检、文旅和酒店。
这条融资新闻的价值,是它把具身智能的资本热度和世界模型路线连在一起。
但融资额和技术愿景不等于商业化结果,仍要看客户交付和真实任务表现。
第十一条来自 ScienceAI,讲 AI 如何把抗生素研发改写成可计算实验。
文章从 enterololin 说起:研究者先筛了一万零七百四十七个小分子。
随后他们接入 DiffDock,用生成式 AI 预测分子作用位点。
模型约一百秒给出答案,指向 LolCDE 脂蛋白转运复合体,再由实验验证。
文章还提到 Chemprop、RDKit、xTB 和 SyntheMol 等工具链。
更大的想象空间,是从一万级筛选走向数百亿候选分子的计算搜索。
但抗生素发现最终仍要跨过毒性、选择性、耐药性和临床验证。
第十二条是论文 Fill the GAP,研究视觉 latent reasoning 为什么不稳定。
论文认为,生成出来的 latent token 可能不在模型熟悉的视觉输入空间里。
GAP 方法从特征、语义和分配三个粒度做对齐。
在 HRBench4K 表里,Ours-GAP 的 Avg-P 高于多个基线。
在 MathVista 表里,GAP 也提升了平均推理表现。
最后一条是 ACL 2026 论文 XtraGPT,讨论 AI 时代论文应该怎样修订。
它不主张从零生成论文,而是在人已有想法、实验和初稿之后,做上下文感知修订。
论文提出一个可控的人机协作框架,让模型按学术共同体标准改写不同章节。
它的修订标准覆盖标题、摘要、引言、背景、实验评价和结论。
评测表显示,长上下文模型和专门修订模型在论文质量评分上差异明显。
机器之心 AI News Digest

机器之心 · 2026.06.16 · 13 stories · 12:29

机器之心 AI News Digest

机器之心 2026.06.16 digest with 13 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 1:07
    01. DeepSeek首次融资落地:募集超500亿,估值超3300亿元 Source
    原文报道 DeepSeek 完成首次对外融资,募资超过 500 亿元人民币,估值超过 500 亿美元。
  2. 1:07 - 2:06
    02. 三连发!阿里发布首个具身大模型Qwen-Robot系列 Source
    阿里发布千问首个具身智能模型系列 Qwen-Robot,覆盖操作、移动和世界模型三类能力。
  3. 2:07 - 3:39
    03. AI Scientists的下一站是社会科学:清华团队推出「硅基社会实验室」AgentSociety² Source
    清华团队提出 AgentSociety²,定位为面向可执行社会科学的一体化研究环境。
  4. 3:39 - 5:24
    04. 年薪300万的前沿部署工程师,要被「录屏教学」替代了 Source
    文章介绍桌面 Agent 产品 Agivar,主张用录屏和演示流程替代复杂提示词,让 AI 学会真实业务操作。
  5. 5:24 - 6:38
    05. 当AI Agent开始工作,安全该如何跟上?AgentDoG 1.5开源发布 Source
    AgentDoG 1.5 是一个面向 AI Agent 的轻量化、可扩展安全诊断与在线护栏框架。
  6. 6:39 - 7:28
    06. 火山引擎发布Seedance 2.0 mini,API将于近期上线 Source
    火山引擎上线 Seedance 2.0 mini 视频生成模型,并称 API 将于近期上线。
  7. 7:28 - 8:13
    07. 上线首月吸引 10 万开发者,AnySearch 为 Agent 解锁网页之外的世界 Source
    AnySearch 定位为 Agent 搜索层,解决传统搜索与 Agent 信息需求之间的错位。
  8. 8:14 - 9:11
    08. Anthropic又摊上事了,夸大使用额度,被用户起诉 Source
    Anthropic 因 Claude Max 订阅使用限制被用户起诉,原文称争议集中在高价套餐实际可用额度。
  9. 9:12 - 9:57
    09. 腾讯1.3亿入局!林俊旸新AI Lab首轮投后估值135亿,已寻求下一轮 Source
    原文报道林俊旸新 AI Lab 完成首轮融资,腾讯、高榕、红杉中国等参与,投后估值约 20 亿美元。
  10. 9:57 - 10:37
    10. 大晓机器人完成天使+轮融资,多家知名财务和产业资本联袂投资,累计融资数亿美元 Source
    大晓机器人完成天使+轮融资,文章称 2026 年上半年累计融资数亿美元。
  11. 10:37 - 11:22
    11. Nature丨从10,747个分子到460亿个候选:AI正在把抗生素研发改写成一门可计算的实验科学 Source
    文章介绍 AI 在抗生素发现中的应用,从 enterololin 的靶点预测到大规模候选分子搜索。
  12. 11:23 - 11:52
    12. 视觉latent reasoning为什么不稳?这篇论文从特征空间找到了关键缺口 Source
    论文提出 GAP,用三层对齐解决视觉 latent reasoning 中 latent token 难以被模型稳定读取的问题。
  13. 11:52 - 12:29
    13. AI时代论文到底该怎么写?XtraGPT重新定义「AI学术写作」 Source
    XtraGPT 是一项关于学术论文修订的 ACL 2026 工作,强调上下文感知和可控的人机协作。