今天机器之心头条,是 DeepSeek 首次对外融资落地,原文称募资超过五百亿元人民币。
报道给出的估值超过五百亿美元,折合约三千三百八十亿元人民币,是中国 AI 行业罕见的大额融资。
这轮交易结构很特殊,多数外部资金投向梁文锋管理的有限合伙企业,而不是直接投给 DeepSeek 本体。
原文称,为确保梁文锋的控制权,投资者资金有五年锁定期,并且通常不获得投票权。
例外是国家人工智能产业投资基金,它直接投资 DeepSeek,并享有公司投票权。
报道还称,梁文锋个人出资二百亿元,腾讯出资一百亿元,宁德时代、京东、网易和 IDG 也参与。
这说明 DeepSeek 的融资并不只是拿钱扩张,更是在筛选长期支持开源路线的资本。
需要注意的是,融资细节来自知情人士和媒体报道,具体协议与股权安排仍需公司层面确认。
第二条是阿里千问进入具身智能,发布 Qwen-Robot 系列。
这个系列包含三类模型:操作模型 Qwen-RobotManip、移动模型 Qwen-RobotNav,以及世界模型 Qwen-RobotWorld。
原文把它比作给机器人装上灵巧的手、认路的脚和会思考的大脑。
Qwen-RobotManip 聚焦 VLA 操作,用统一动作表征和相对位置操作,降低换硬件、换场景后的迁移成本。
Qwen-RobotNav 面向导航,目标是让机器人听懂自然语言并在陌生环境里移动。
Qwen-RobotWorld 则承担世界模型角色,让机器人理解物理规律和环境变化。
这条新闻的意义是,千问从语言和多模态能力继续向现实控制扩展。
后续要验证的是,它在不同硬件上的泛化、数据来源和实际任务成功率。
第三条看清华团队的 AgentSociety²,它把 AI Scientist 的方向推进到社会科学实验。
AgentSociety 的想法,是在计算机里构建可运行、可干预、可复现的硅基社会。
第一代系统已经能让大语言模型智能体进入大规模社会模拟,观察群体行为如何涌现。
它把选题、文献检索、假设生成、实验设计、仿真配置、执行和分析放进一个闭环。
这意味着 AI 不只是生成研究建议,而是参与从问题到实验再到论文草稿的流程。
在工程上,CodeGenRouter 和环境模块负责把研究意图转成可运行的仿真实验。
原文展示的案例包括社交媒体动力学、城市生活、舆论极化和灾害移动等问题。
结果图说明,这类平台开始把社会科学中的干预和对照实验变成可重复的计算流程。
它的价值不是替代真实社会调查,而是让研究者先在可控环境中探索机制和假设。
如果平台成熟,AI Scientist 将不只做自然科学实验,也会进入复杂人类行为研究。
但模拟社会和真实社会之间仍有差距,智能体行为、数据偏差和伦理边界都需要持续验证。
第四条是桌面 Agent 产品 Agivar,核心主张是不用写复杂提示词,直接录屏教 AI 做事。
原文先指出一个行业痛点:Agent 会执行任务,但很多员工说不清自己的工作流程。
这催生了前沿部署工程师,把真实业务流程翻译成 AI 能执行的步骤。
Agivar 的选择是反过来,让用户演示流程,让 AI 从屏幕操作中学习。
在演示里,用户不需要把每个点击写成 prompt,而是像平常一样打开系统、选择数据、执行操作。
产品图把这个差异说得很直白:提示词像写说明书,录屏教学像带 AI 看一遍。
架构上,Agivar 被描述为大脑加小脑:大模型负责理解和规划,小模型负责界面识别、鼠标点击和键盘输入。
三层设计则强调训练收敛、多重校验和规则约束,用来减少执行中的不确定性。
第二段演示更接近真实工作:Agivar 在后台系统中打开输入面板,填写部门和金融中心等字段。
视频里还能看到,它记录录入耗时,并把流程作为可复用的自动化任务。
如果这类方法成熟,企业部署 Agent 的瓶颈会从写提示词,转向流程采集、验证和权限治理。
但风险也很明确:桌面录屏会接触内部系统、个人数据和业务权限,不能只看便利性。
这条新闻真正重要的地方,是它把教 AI 工作从语言描述推进到行为示范。
第五条是 Agent 安全。上海人工智能实验室发布 AgentDoG 1.5,面向 AI Agent 的安全诊断和在线护栏。
原文强调,Agent 风险不只在最终回答里,也会藏在工具调用、环境反馈、记忆和执行轨迹里。
AgentDoG 1.5 的核心,是从看输出转向看轨迹。
它既可以作为训练数据生成器,也可以作为运行时监控和告警框架。
分类体系把风险拆到执行设置、轨迹和现实影响等维度。
原文还给出三组数据集:ATBench、ATBench-Claw 和 ATBench-Codes。
评测图显示,不同模型和训练策略在风险识别、攻击场景和真实世界伤害维度上差异明显。
雷达图进一步说明,安全能力不是单一分数,而是多维能力组合。
对越来越多能读写文件、调用工具和操作代码的 Agent 来说,这类轨迹级护栏会变得更重要。
但开源框架是否能覆盖企业真实系统,还要看接入成本、误报率和运行时延迟。
第六条是火山引擎发布 Seedance 2.0 mini,定位为高性价比视频生成模型。
原文称,它将于近期上线 API,面向更广泛的视频创作和规模化生产。
按 720P 规格折算,Seedance 2.0 mini 单秒生成成本约为 0.5 元。
文章还说,相比 Seedance 2.0,它的生成成本降低约一半。
应用场景包括电商内容生产、营销素材批量生成、UGC 创作和特效玩法。
这条新闻的关键,是视频生成竞争开始从效果扩展到 API 成本和工业化可用性。
不过,价格优势还需要和实际可控性、稳定性、速度以及版权风险一起评估。
第七条是 AnySearch,一个面向 Agent 的搜索层服务。
文章认为,现在的搜索引擎主要为人的眼睛设计,而 Agent 需要更可靠、更可消化的信息输入。
AnySearch 上线首月吸引十万名开发者,累计搜索调用量突破四百万次。
原文称,它上线一周冲上 Agent 技能市场 Skills.sh 热榜第一。
产品逻辑不是只做 Top-K 相关性,而是服务后续推理链路。
这说明 Agent 竞争不只看模型,还要看信息获取层。
后续要验证的是,它在金融、法律、学术和威胁情报等专业数据源上的稳定性。
第八条是 Anthropic 被用户起诉,争议集中在 Claude Max 高价订阅的实际使用额度。
《华尔街日报》报道称,用户指控 Anthropic 夸大 Max 计划可用额度。
诉讼希望代表购买过 Max 5x 和 Max 20x 的用户,要求赔偿。
Max 20x 每月 200 美元,Max 5x 每月 100 美元,比 Pro 订阅贵很多。
用户抱怨的核心,是高价计划仍会在单次会话或短时间内触发额度限制。
另一边,Anthropic 也暂缓了 Agent SDK 计费调整,说明开发者计费压力已经被听见。
这条新闻不是单纯消费纠纷,而是 AI 订阅套餐如何描述真实算力资源的问题。
后续要看法院是否认定营销表述误导,以及 Anthropic 是否调整套餐透明度。
第九条是林俊旸新 AI Lab 融资,腾讯据称投入两千万美元。
原文称首轮融资总额达数亿美元,投后估值约二十亿美元。
高榕创投和红杉中国被报道为领投方,两家机构各投资一亿美元。
投资人押注他的关键背景,是他曾是阿里 Qwen 系列的重要技术负责人。
文章回顾称,他从达摩院多模态模型团队起步,后来接手通义千问系列。
这也说明中国大模型赛道的资本竞争,正在从公司品牌延伸到核心技术负责人。
不过,公司产品路线、模型发布节奏和融资细节仍需要后续公开信息确认。
第十条是大晓机器人完成天使加轮融资,原文称今年上半年累计融资数亿美元。
文章重点提到开悟世界模型 3.0,强调理解、生成和预测一体化。
这条融资新闻的价值,是它把具身智能的资本热度和世界模型路线连在一起。
但融资额和技术愿景不等于商业化结果,仍要看客户交付和真实任务表现。
第十一条来自 ScienceAI,讲 AI 如何把抗生素研发改写成可计算实验。
文章从 enterololin 说起:研究者先筛了一万零七百四十七个小分子。
随后他们接入 DiffDock,用生成式 AI 预测分子作用位点。
模型约一百秒给出答案,指向 LolCDE 脂蛋白转运复合体,再由实验验证。
文章还提到 Chemprop、RDKit、xTB 和 SyntheMol 等工具链。
更大的想象空间,是从一万级筛选走向数百亿候选分子的计算搜索。
但抗生素发现最终仍要跨过毒性、选择性、耐药性和临床验证。
第十二条是论文 Fill the GAP,研究视觉 latent reasoning 为什么不稳定。
论文认为,生成出来的 latent token 可能不在模型熟悉的视觉输入空间里。
在 HRBench4K 表里,Ours-GAP 的 Avg-P 高于多个基线。
在 MathVista 表里,GAP 也提升了平均推理表现。
最后一条是 ACL 2026 论文 XtraGPT,讨论 AI 时代论文应该怎样修订。
它不主张从零生成论文,而是在人已有想法、实验和初稿之后,做上下文感知修订。
论文提出一个可控的人机协作框架,让模型按学术共同体标准改写不同章节。
它的修订标准覆盖标题、摘要、引言、背景、实验评价和结论。
评测表显示,长上下文模型和专门修订模型在论文质量评分上差异明显。