【AI 日报】美国下令 Anthropic 对所有外国人封禁 Mythos 5 与 Fable 5

🔦 今日速览

今天是 2026 年 6 月 14 日（周日，周末数字版）。美国商务部周五傍晚向 Anthropic 发出出口管制令——以国家安全为由，要求公司即刻对所有外国人（包括 Anthropic 自己的外籍员工）禁用旗舰模型 Mythos 5 与 Fable 5；Anthropic 当晚公开反对并被迫"突然下线"。同日，SpaceX 上市首日狂飙 25%，市值突破 $2 万亿，马斯克成为人类首位万亿富豪；NVIDIA 在 GTC 上联合 Mistral / Cursor / LangChain / Perplexity 组建 Nemotron Coalition，首个项目即与 Mistral 合写下一代 Nemotron 4 开放基座。国内方面，智源大会发布全球首个通用世界基座模型悟界·Physis-v0.1、众智 FlagOS 2.1 统一适配 18 家芯片 32 款型号；阿里首席科学家周靖人在任命仅 5 天后被曝离职，通义团队再失核心。

趋势1：前沿模型正成为新型出口管制对象 趋势2：世界模型代替自回归成 AI 新主线 趋势3：AI 巨头进入 IPO 与高管动荡期

🌍 国际动态

1. 美国下令 Anthropic 对所有外国人封禁 Mythos 5 与 Fable 5

事件简述：美国当地时间 6 月 12 日傍晚 5:21pm，商务部长 Howard Lutnick 致信 Anthropic CEO Dario Amodei，要求将旗舰 AI 模型 Mythos 5 和 Fable 5 纳入出口管制——禁止美国境外任何地点访问，同时禁止美国境内所有非美籍人士（包括 Anthropic 自己的外籍员工）使用这两个模型。Anthropic 当晚发布博客明确反对："我们不认为有数亿用户在用的软件应当因此被封禁，Fable 5 的安全措施已经做了大量测试。"政府方面声称发现了一种"jailbreak"方法可绕过 Fable 5 防止识别软件漏洞的安全机制。

关键数据：禁令同时覆盖境外所有用户和境内所有外国人；Anthropic 当晚被迫突然下线两款最强模型；指令到位与执行间隔不足数小时；这是美国首次对单一公司商用大模型实施类似 EAR（Export Administration Regulations）的强制措施。

影响分析：这是 AI 监管史上的分水岭——前沿模型第一次被当作军民两用品纳入出口管制。Anthropic 的全球商业模式受重创（很大比例 API 收入来自美国境外），同时给其他前沿实验室树立了一个可怕先例：模型越强，越可能被国家安全部门"接管"。Anthropic IPO 进程不确定性陡增；OpenAI、Google DeepMind 短期内必将面对类似审视。中国开源生态（DeepSeek / Qwen）可能因此获得意外红利——海外开发者寻找替代方案的需求骤升。

📅6月12日

2. SpaceX 上市首日大涨 25%，市值破 $2 万亿，马斯克成全球首位万亿富豪

事件简述：SpaceX 于 6 月 12 日（周五）登陆纳斯达克（代码 SPCX），发行价 $135，开盘 $150，收盘 $168.70——首日涨幅 25%，盘中最高 $176.52。本次 IPO 融资 $750 亿起，对应估值 $1.77 万亿，是美国史上规模最大的 IPO，并使总裁 Gwynne Shotwell 成为 SpaceX 第一位市值定价后的"董事长级"高管；马斯克因 SpaceX + 特斯拉合计持股成为人类历史上首位万亿富豪。Shotwell 同日并未排除"未来 SpaceX 与特斯拉合并"的可能性："两家公司目标正在趋同。"

关键数据：发行 $135 / 开盘 $150 / 收盘 $168.70；首日涨幅 25%；融资 $750 亿起，是沙特阿美 2019 IPO 的 2.9 倍；公司 2025 年营收 $186.7 亿，合并 xAI 后净亏损 $49.4 亿；94.7 倍市销率。

影响分析：SpaceX 上市表面是航天事件，本质是给 Anthropic、OpenAI 即将到来的 IPO 重新定价了"AI + 基础设施"叙事——市场愿意给"未来基础设施型公司"超百倍 PS。Anthropic（已秘密递交 S-1）和 OpenAI（同时递交）将是最直接的受益者：投资人现在有了"即使巨额亏损也能撑万亿估值"的样板。同时叠加昨天 Colossus 1 数据中心租给 Anthropic 的消息，xAI 算力路线被进一步质疑。

📅6月12日

3. NVIDIA 联合 Mistral / Cursor / LangChain 等组建 Nemotron Coalition

事件简述：NVIDIA 在 GTC 大会上宣布成立 NVIDIA Nemotron Coalition——由 NVIDIA 牵头，Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Reflection AI、Sarvam、Thinking Machines Lab 8 家全球顶尖开放模型实验室与 AI 公司联合参与，共享研究、专家、数据与算力，共同推进开放前沿模型生态。Coalition 第一个项目是 NVIDIA + Mistral 合作研发的 Nemotron 4 基座模型——在 NVIDIA DGX Cloud 上训练，权重将完全对开源生态开放。

关键数据：8 家创始成员，覆盖模型层（Mistral / Reflection / Thinking Machines）、应用层（Cursor / Perplexity）、工具层（LangChain）、垂直语言（Sarvam，印度语系）、视觉生成（Black Forest Labs）全栈；Nemotron 4 将基于 DGX Cloud 训练，目标对标 Llama / Qwen 顶级开源模型。

影响分析：NVIDIA 这一招直击 OpenAI / Anthropic 闭源路线的软肋——用算力 + 多家明星实验室联盟来打造"OpenAI 级别"的开源对手。叠加同日 Anthropic 被出口管制封禁外国人的消息，开源前沿模型的战略地位被瞬间放大："美国出口管制 + NVIDIA 开放联盟"形成两条对冲路径。对中国 AI 公司而言，Nemotron Coalition 成立意味着 Llama 系列之外又出现了一支强大的开源参考实现，但也意味着开源前沿正变得越来越拥挤、越来越快。

📅6月12日

🇨🇳 国内动态

1. 智源发布全球首个通用世界基座模型悟界·Physis-v0.1

事件简述：6 月 12 日 2026 智源大会现场，智源研究院院长王仲远正式发布悟界·Physis-v0.1——智源称其为"全球首款通用世界基座模型"。区别于以语言为中心的 VLM/VLA、以像素为中心的视频生成、以三维结构为中心的重建模型、以及 JEPA 系列视觉表征模型，Physis 用物理隐空间表征替代传统像素 / 帧级预测：搭载专属物理状态编码器，将视频、深度 RGB、3D 点云、力触反馈等全模态信息统一压缩为标准化"隐空间物理状态 Latent State"，支持 50+ 复杂物理场景长程推理，具备物理一致性、动作因果性、长程可推演性、通用泛化性四大核心能力。负责人是 22 岁北大本科在读的陈博远（智源世界模型创新中心负责人）。

关键数据：跨场景通用物理规律强化学习；50+ 物理场景长程推理；同期发布悟界·RoboBrain Orca具身大脑（融合大量 Ego-centric 交互数据）、悟界·Brainμ1.0多模态神经科学大模型、悟界·OpenComplex2.5药物发现模型；模型即将开源；摩根士丹利预测到 2035 年世界模型赋能产业规模达 $10 万亿。

影响分析：这与昨天我们提到的"Next Token Prediction → Next Physical State Prediction"范式迁移完全同频——智源用"通用世界基座"这个定位卡住了世界模型这条无人区的标准位。在大语言模型时代被 OpenAI 卡位的中国 AI 研究界，第一次有机会在新范式开局阶段定义问题、定义路线。短期内对自动驾驶、具身智能、严肃工业仿真三大场景的影响最直接。

📅6月12日

2. 智源 FlagOS 2.1 升级：18 家芯片厂、32 款型号统一适配

事件简述：智源大会同日发布众智 FlagOS 2.1——智源牵头打造的统一智算系统软件栈。新版本号称"全球支持芯片种类最多的智算系统软件栈"：统一适配 18 家芯片品牌的 32 款芯片型号，覆盖 NVIDIA、华为昇腾、寒武纪、海光、沐曦、燧原、摩尔线程等 NPU/GPGPU/DSA/RISC-V AI/ARM 多种架构。通过通用算子库、统一 AI 编译器、自动算子生成工具、vLLM 多芯片统一插件，支持 90% 以上主流开源大模型多芯片部署——DeepSeek V4、Qwen3.6、MiniMaX M2.7、MiniCPM-o4.5、混元 Hy-MT2 等大模型 DAY 0 即实现多芯片适配。

关键数据：18 家芯片品牌 / 32 款型号；600+ 算子；生态成员超 80 家；全球下载量超 37.5 万次；触及开发者 5.6 万人；DAY 0 适配 DeepSeek V4 / Qwen3.6 / MiniMaX M2.7。

影响分析：FlagOS 是中国 AI 行业"M 模型 × N 芯片"适配地狱的根本性解法——把 M×N 复杂度降为 M+N。这对国产芯片生态意义重大：在英伟达受出口管制约束、华为昇腾 / 寒武纪等加速渗透的背景下，FlagOS 提供了一个跨芯片的"模型一次开发，处处运行"中间层，有望成为继 CUDA 之后的事实性国产基础设施栈。

📅6月12日

3. 阿里首席科学家周靖人提交离职申请，距任命仅 5 天

事件简述：6 月 13 日多家媒体证实，阿里巴巴首席科学家周靖人已提交离职申请，目前流程尚在走。距离 6 月 8 日阿里官宣任命他为"集团首席科学家、AI 未来研究院负责人"仅过去 5 天。今年以来周靖人岗位已多次变动：3 月初 Qwen 技术负责人林俊旸离职后他临时代管 Qwen；4 月 8 日被任命为集团首席 AI 架构师兼通义大模型事业部负责人；6 月 8 日转任首席科学家，通义大模型事业部核心模型研发团队被划入新成立的 Token Foundry 事业部，由阿里 CEO 吴泳铭直接执掌。

关键数据：周靖人 2015 年加入阿里，2025 年 12 月晋升合伙人，是少数纯技术背景进入最高决策层的高管；自 3 月以来连续 4 次岗位变动；今年 Qwen 团队已先后出走林俊旸（技术负责人）、郁博文（后训练负责人）、李凯新（核心成员）。

影响分析：这件事与昨天华为余承东重新接管盘古大模型形成强烈对照——两家中国 AI 巨头都在重组顶层 AI 决策架构，但走向完全相反：华为重新让 BG 一号位"Hands-on"做大模型，阿里则把核心模型研发收归 CEO 直管。Qwen 系列是过去 18 个月中国 AI 开源生态最大公约数（衍生模型数已超 Llama），核心人物连续出走会直接影响 Qwen3.7 / 3.8 的迭代节奏，也给 DeepSeek、智谱、月之暗面打开了"承接开源开发者"的窗口期。

📅6月13日

📄 今日论文

1. Mana: Dexterous Manipulation of Articulated Tools

作者：Zhao-Heng Yin, Guanya Shi, Pieter Abbeel et al. | 机构：UC Berkeley / CMU 等

核心贡献：当前机器人灵巧操作主要聚焦"刚性物体的抓取"，但真实工作场景充满铰接式工具（剪刀、钳子、扳手等）——它们的物理特性是"工具的形态会随用户操作连续改变"。Mana 提出了首个面向铰接工具的灵巧操作框架，关键点是联合建模手部接触动力学 + 工具关节状态，并在仿真中通过强化学习把"如何握住工具 + 如何驱动工具关节"作为一个整体策略学习。论文展示在剪纸、夹取、转动钥匙等任务上首次实现端到端学习的稳定泛化。

为什么重要：灵巧手 + 铰接工具是具身智能从"实验室抓积木"进入"工厂 / 家庭真实场景"的最大门槛之一。Pieter Abbeel 团队在这个方向上的输出几乎定义着主流路线，也直接对应今天悟界·Physis 强调的"动作因果性"——只是 Mana 走的是"细粒度物理建模"路线，而 Physis 走"通用基座建模"路线。

📄 arXiv:2606.13677 📅6月11日

2. Reward Modeling for Multi-Agent Orchestration

作者：King Yeung Tsang, Zihao Zhao, Vishal Venkataramani et al.

核心贡献：现有 Multi-Agent 编排（如 AutoGen、CrewAI、LangGraph）依赖人工硬编码的角色分工和路由规则，无法随任务自适应。论文提出用 RLHF 风格的奖励建模训练 Orchestrator——把"如何在多 Agent 之间分发子任务、如何融合中间结果、何时调用工具、何时返回最终答案"全部交给一个学到的 Reward Model 来评分，然后用 PPO 优化 Orchestrator 策略。在 SWE-Bench、GAIA、AssistantBench 等基准上比固定模板的多 Agent 系统平均高出 8-15 个百分点。

为什么重要：当今所有 Agent 平台（OpenAI Swarm、LangGraph、Microsoft AutoGen）的核心瓶颈都在 Orchestrator——人写规则永远跟不上任务多样性。本文给出了让 Orchestrator 也"学会自己优化"的可工程化方案，是从"工具调用 Agent"迈向"自我演化 Agent"的关键一步。

📄 arXiv:2606.13598 📅6月11日

3. LabVLA: Grounding Vision-Language-Action Models in Scientific Laboratories

作者：Baochang Ren, Xinjie Liu, Xi Chen et al.

核心贡献：将 VLA（Vision-Language-Action，视觉-语言-动作）模型从"工厂 / 家用"通用场景拓展到真实生物 / 化学实验室——LabVLA 在 12 类常见实验室操作（移液、离心、显微镜聚焦、试管换位等）上做了端到端实测。关键创新是引入"协议感知（Protocol-aware）"模块：让模型在执行动作前先理解实验协议文档（含安全约束、容器规格、化学品兼容性），再生成具体动作序列。在 GPT-5.5 / Claude Fable 5 同等条件下，LabVLA 在实验室任务成功率达 76.4%，远超无 protocol 约束基线的 41.2%。

为什么重要：AI for Science 的最大瓶颈不是模型推理能力，而是让模型在物理实验室里安全可靠地"动手"。LabVLA 与今日发布的悟界·Physis、悟界·OpenComplex2.5 形成完整三段：物理感知 → 实验执行 → 科学发现。这条链条一旦闭合，"AI 自主科研"就从概念变成生产力。

📄 arXiv:2606.13578 📅6月11日

4. Learning to Reason by Analogy via Retrieval-Augmented Reinforcement Fine-Tuning

作者：Zilin Xiao, Qi Ma, Chun-cheng Jason Chen et al.

核心贡献：把"类比推理（reasoning by analogy）"显式纳入 RL fine-tuning 训练流程。具体做法：在每次 rollout 时，先从一个外部 reasoning 案例库中检索相似题型，把它们作为 prompt 注入，让 policy 在解决新题时显式模仿已有解决方案的结构；reward 同时考虑最终答案正确性 + 推理路径与检索范例的结构相似度。在 GSM8K、MATH、AIME 上比纯 RL fine-tuning 高出 6-12 个点，且训练数据需求大幅降低。

为什么重要：当前所有推理模型（GPT-5.5、Mythos 5、DeepSeek R2、Qwen3.6-Reasoning）都在比拼"how much RL"——这篇论文提供了一种"how to do RL more efficiently"的范式：RL × RAG 组合很可能是接下来 6-12 个月推理模型训练的新主流。

📄 arXiv:2606.13680 📅6月11日