🔦 今日速览
今天是 2026 年 6 月 14 日(周日,周末数字版)。美国商务部周五傍晚向 Anthropic 发出出口管制令——以国家安全为由,要求公司即刻对所有外国人(包括 Anthropic 自己的外籍员工)禁用旗舰模型 Mythos 5 与 Fable 5;Anthropic 当晚公开反对并被迫"突然下线"。同日,SpaceX 上市首日狂飙 25%,市值突破 $2 万亿,马斯克成为人类首位万亿富豪;NVIDIA 在 GTC 上联合 Mistral / Cursor / LangChain / Perplexity 组建 Nemotron Coalition,首个项目即与 Mistral 合写下一代 Nemotron 4 开放基座。国内方面,智源大会发布全球首个通用世界基座模型悟界·Physis-v0.1、众智 FlagOS 2.1 统一适配 18 家芯片 32 款型号;阿里首席科学家周靖人在任命仅 5 天后被曝离职,通义团队再失核心。
趋势1:前沿模型正成为新型出口管制对象 趋势2:世界模型代替自回归成 AI 新主线 趋势3:AI 巨头进入 IPO 与高管动荡期
🌍 国际动态
1. 美国下令 Anthropic 对所有外国人封禁 Mythos 5 与 Fable 5
事件简述:美国当地时间 6 月 12 日傍晚 5:21pm,商务部长 Howard Lutnick 致信 Anthropic CEO Dario Amodei,要求将旗舰 AI 模型 Mythos 5 和 Fable 5 纳入出口管制——禁止美国境外任何地点访问,同时禁止美国境内所有非美籍人士(包括 Anthropic 自己的外籍员工)使用这两个模型。Anthropic 当晚发布博客明确反对:"我们不认为有数亿用户在用的软件应当因此被封禁,Fable 5 的安全措施已经做了大量测试。"政府方面声称发现了一种"jailbreak"方法可绕过 Fable 5 防止识别软件漏洞的安全机制。
关键数据:禁令同时覆盖境外所有用户和境内所有外国人;Anthropic 当晚被迫突然下线两款最强模型;指令到位与执行间隔不足数小时;这是美国首次对单一公司商用大模型实施类似 EAR(Export Administration Regulations)的强制措施。
影响分析:这是 AI 监管史上的分水岭——前沿模型第一次被当作军民两用品纳入出口管制。Anthropic 的全球商业模式受重创(很大比例 API 收入来自美国境外),同时给其他前沿实验室树立了一个可怕先例:模型越强,越可能被国家安全部门"接管"。Anthropic IPO 进程不确定性陡增;OpenAI、Google DeepMind 短期内必将面对类似审视。中国开源生态(DeepSeek / Qwen)可能因此获得意外红利——海外开发者寻找替代方案的需求骤升。
📅6月12日
2. SpaceX 上市首日大涨 25%,市值破 $2 万亿,马斯克成全球首位万亿富豪
事件简述:SpaceX 于 6 月 12 日(周五)登陆纳斯达克(代码 SPCX),发行价 $135,开盘 $150,收盘 $168.70——首日涨幅 25%,盘中最高 $176.52。本次 IPO 融资 $750 亿起,对应估值 $1.77 万亿,是美国史上规模最大的 IPO,并使总裁 Gwynne Shotwell 成为 SpaceX 第一位市值定价后的"董事长级"高管;马斯克因 SpaceX + 特斯拉合计持股成为人类历史上首位万亿富豪。Shotwell 同日并未排除"未来 SpaceX 与特斯拉合并"的可能性:"两家公司目标正在趋同。"
关键数据:发行 $135 / 开盘 $150 / 收盘 $168.70;首日涨幅 25%;融资 $750 亿起,是沙特阿美 2019 IPO 的 2.9 倍;公司 2025 年营收 $186.7 亿,合并 xAI 后净亏损 $49.4 亿;94.7 倍市销率。
影响分析:SpaceX 上市表面是航天事件,本质是给 Anthropic、OpenAI 即将到来的 IPO 重新定价了"AI + 基础设施"叙事——市场愿意给"未来基础设施型公司"超百倍 PS。Anthropic(已秘密递交 S-1)和 OpenAI(同时递交)将是最直接的受益者:投资人现在有了"即使巨额亏损也能撑万亿估值"的样板。同时叠加昨天 Colossus 1 数据中心租给 Anthropic 的消息,xAI 算力路线被进一步质疑。
📅6月12日
3. NVIDIA 联合 Mistral / Cursor / LangChain 等组建 Nemotron Coalition
事件简述:NVIDIA 在 GTC 大会上宣布成立 NVIDIA Nemotron Coalition——由 NVIDIA 牵头,Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Reflection AI、Sarvam、Thinking Machines Lab 8 家全球顶尖开放模型实验室与 AI 公司联合参与,共享研究、专家、数据与算力,共同推进开放前沿模型生态。Coalition 第一个项目是 NVIDIA + Mistral 合作研发的 Nemotron 4 基座模型——在 NVIDIA DGX Cloud 上训练,权重将完全对开源生态开放。
关键数据:8 家创始成员,覆盖模型层(Mistral / Reflection / Thinking Machines)、应用层(Cursor / Perplexity)、工具层(LangChain)、垂直语言(Sarvam,印度语系)、视觉生成(Black Forest Labs)全栈;Nemotron 4 将基于 DGX Cloud 训练,目标对标 Llama / Qwen 顶级开源模型。
影响分析:NVIDIA 这一招直击 OpenAI / Anthropic 闭源路线的软肋——用算力 + 多家明星实验室联盟来打造"OpenAI 级别"的开源对手。叠加同日 Anthropic 被出口管制封禁外国人的消息,开源前沿模型的战略地位被瞬间放大:"美国出口管制 + NVIDIA 开放联盟"形成两条对冲路径。对中国 AI 公司而言,Nemotron Coalition 成立意味着 Llama 系列之外又出现了一支强大的开源参考实现,但也意味着开源前沿正变得越来越拥挤、越来越快。
📅6月12日
🇨🇳 国内动态
1. 智源发布全球首个通用世界基座模型悟界·Physis-v0.1
事件简述:6 月 12 日 2026 智源大会现场,智源研究院院长王仲远正式发布悟界·Physis-v0.1——智源称其为"全球首款通用世界基座模型"。区别于以语言为中心的 VLM/VLA、以像素为中心的视频生成、以三维结构为中心的重建模型、以及 JEPA 系列视觉表征模型,Physis 用物理隐空间表征替代传统像素 / 帧级预测:搭载专属物理状态编码器,将视频、深度 RGB、3D 点云、力触反馈等全模态信息统一压缩为标准化"隐空间物理状态 Latent State",支持 50+ 复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性、通用泛化性四大核心能力。负责人是 22 岁北大本科在读的陈博远(智源世界模型创新中心负责人)。
关键数据:跨场景通用物理规律强化学习;50+ 物理场景长程推理;同期发布悟界·RoboBrain Orca具身大脑(融合大量 Ego-centric 交互数据)、悟界·Brainμ1.0多模态神经科学大模型、悟界·OpenComplex2.5药物发现模型;模型即将开源;摩根士丹利预测到 2035 年世界模型赋能产业规模达 $10 万亿。
影响分析:这与昨天我们提到的"Next Token Prediction → Next Physical State Prediction"范式迁移完全同频——智源用"通用世界基座"这个定位卡住了世界模型这条无人区的标准位。在大语言模型时代被 OpenAI 卡位的中国 AI 研究界,第一次有机会在新范式开局阶段定义问题、定义路线。短期内对自动驾驶、具身智能、严肃工业仿真三大场景的影响最直接。
📅6月12日
2. 智源 FlagOS 2.1 升级:18 家芯片厂、32 款型号统一适配
事件简述:智源大会同日发布众智 FlagOS 2.1——智源牵头打造的统一智算系统软件栈。新版本号称"全球支持芯片种类最多的智算系统软件栈":统一适配 18 家芯片品牌的 32 款芯片型号,覆盖 NVIDIA、华为昇腾、寒武纪、海光、沐曦、燧原、摩尔线程等 NPU/GPGPU/DSA/RISC-V AI/ARM 多种架构。通过通用算子库、统一 AI 编译器、自动算子生成工具、vLLM 多芯片统一插件,支持 90% 以上主流开源大模型多芯片部署——DeepSeek V4、Qwen3.6、MiniMaX M2.7、MiniCPM-o4.5、混元 Hy-MT2 等大模型 DAY 0 即实现多芯片适配。
关键数据:18 家芯片品牌 / 32 款型号;600+ 算子;生态成员超 80 家;全球下载量超 37.5 万次;触及开发者 5.6 万人;DAY 0 适配 DeepSeek V4 / Qwen3.6 / MiniMaX M2.7。
影响分析:FlagOS 是中国 AI 行业"M 模型 × N 芯片"适配地狱的根本性解法——把 M×N 复杂度降为 M+N。这对国产芯片生态意义重大:在英伟达受出口管制约束、华为昇腾 / 寒武纪等加速渗透的背景下,FlagOS 提供了一个跨芯片的"模型一次开发,处处运行"中间层,有望成为继 CUDA 之后的事实性国产基础设施栈。
📅6月12日
3. 阿里首席科学家周靖人提交离职申请,距任命仅 5 天
事件简述:6 月 13 日多家媒体证实,阿里巴巴首席科学家周靖人已提交离职申请,目前流程尚在走。距离 6 月 8 日阿里官宣任命他为"集团首席科学家、AI 未来研究院负责人"仅过去 5 天。今年以来周靖人岗位已多次变动:3 月初 Qwen 技术负责人林俊旸离职后他临时代管 Qwen;4 月 8 日被任命为集团首席 AI 架构师兼通义大模型事业部负责人;6 月 8 日转任首席科学家,通义大模型事业部核心模型研发团队被划入新成立的 Token Foundry 事业部,由阿里 CEO 吴泳铭直接执掌。
关键数据:周靖人 2015 年加入阿里,2025 年 12 月晋升合伙人,是少数纯技术背景进入最高决策层的高管;自 3 月以来连续 4 次岗位变动;今年 Qwen 团队已先后出走林俊旸(技术负责人)、郁博文(后训练负责人)、李凯新(核心成员)。
影响分析:这件事与昨天华为余承东重新接管盘古大模型形成强烈对照——两家中国 AI 巨头都在重组顶层 AI 决策架构,但走向完全相反:华为重新让 BG 一号位"Hands-on"做大模型,阿里则把核心模型研发收归 CEO 直管。Qwen 系列是过去 18 个月中国 AI 开源生态最大公约数(衍生模型数已超 Llama),核心人物连续出走会直接影响 Qwen3.7 / 3.8 的迭代节奏,也给 DeepSeek、智谱、月之暗面打开了"承接开源开发者"的窗口期。
📅6月13日
📄 今日论文
1. Mana: Dexterous Manipulation of Articulated Tools
作者:Zhao-Heng Yin, Guanya Shi, Pieter Abbeel et al. | 机构:UC Berkeley / CMU 等
核心贡献:当前机器人灵巧操作主要聚焦"刚性物体的抓取",但真实工作场景充满铰接式工具(剪刀、钳子、扳手等)——它们的物理特性是"工具的形态会随用户操作连续改变"。Mana 提出了首个面向铰接工具的灵巧操作框架,关键点是联合建模手部接触动力学 + 工具关节状态,并在仿真中通过强化学习把"如何握住工具 + 如何驱动工具关节"作为一个整体策略学习。论文展示在剪纸、夹取、转动钥匙等任务上首次实现端到端学习的稳定泛化。
为什么重要:灵巧手 + 铰接工具是具身智能从"实验室抓积木"进入"工厂 / 家庭真实场景"的最大门槛之一。Pieter Abbeel 团队在这个方向上的输出几乎定义着主流路线,也直接对应今天悟界·Physis 强调的"动作因果性"——只是 Mana 走的是"细粒度物理建模"路线,而 Physis 走"通用基座建模"路线。
📄 arXiv:2606.13677 📅6月11日
2. Reward Modeling for Multi-Agent Orchestration
作者:King Yeung Tsang, Zihao Zhao, Vishal Venkataramani et al.
核心贡献:现有 Multi-Agent 编排(如 AutoGen、CrewAI、LangGraph)依赖人工硬编码的角色分工和路由规则,无法随任务自适应。论文提出用 RLHF 风格的奖励建模训练 Orchestrator——把"如何在多 Agent 之间分发子任务、如何融合中间结果、何时调用工具、何时返回最终答案"全部交给一个学到的 Reward Model 来评分,然后用 PPO 优化 Orchestrator 策略。在 SWE-Bench、GAIA、AssistantBench 等基准上比固定模板的多 Agent 系统平均高出 8-15 个百分点。
为什么重要:当今所有 Agent 平台(OpenAI Swarm、LangGraph、Microsoft AutoGen)的核心瓶颈都在 Orchestrator——人写规则永远跟不上任务多样性。本文给出了让 Orchestrator 也"学会自己优化"的可工程化方案,是从"工具调用 Agent"迈向"自我演化 Agent"的关键一步。
📄 arXiv:2606.13598 📅6月11日
3. LabVLA: Grounding Vision-Language-Action Models in Scientific Laboratories
作者:Baochang Ren, Xinjie Liu, Xi Chen et al.
核心贡献:将 VLA(Vision-Language-Action,视觉-语言-动作)模型从"工厂 / 家用"通用场景拓展到真实生物 / 化学实验室——LabVLA 在 12 类常见实验室操作(移液、离心、显微镜聚焦、试管换位等)上做了端到端实测。关键创新是引入"协议感知(Protocol-aware)"模块:让模型在执行动作前先理解实验协议文档(含安全约束、容器规格、化学品兼容性),再生成具体动作序列。在 GPT-5.5 / Claude Fable 5 同等条件下,LabVLA 在实验室任务成功率达 76.4%,远超无 protocol 约束基线的 41.2%。
为什么重要:AI for Science 的最大瓶颈不是模型推理能力,而是让模型在物理实验室里安全可靠地"动手"。LabVLA 与今日发布的悟界·Physis、悟界·OpenComplex2.5 形成完整三段:物理感知 → 实验执行 → 科学发现。这条链条一旦闭合,"AI 自主科研"就从概念变成生产力。
📄 arXiv:2606.13578 📅6月11日
4. Learning to Reason by Analogy via Retrieval-Augmented Reinforcement Fine-Tuning
作者:Zilin Xiao, Qi Ma, Chun-cheng Jason Chen et al.
核心贡献:把"类比推理(reasoning by analogy)"显式纳入 RL fine-tuning 训练流程。具体做法:在每次 rollout 时,先从一个外部 reasoning 案例库中检索相似题型,把它们作为 prompt 注入,让 policy 在解决新题时显式模仿已有解决方案的结构;reward 同时考虑最终答案正确性 + 推理路径与检索范例的结构相似度。在 GSM8K、MATH、AIME 上比纯 RL fine-tuning 高出 6-12 个点,且训练数据需求大幅降低。
为什么重要:当前所有推理模型(GPT-5.5、Mythos 5、DeepSeek R2、Qwen3.6-Reasoning)都在比拼"how much RL"——这篇论文提供了一种"how to do RL more efficiently"的范式:RL × RAG 组合很可能是接下来 6-12 个月推理模型训练的新主流。
📄 arXiv:2606.13680 📅6月11日