🔦 今日速览
今天是 2026 年 6 月 13 日(周六),昨日 HDC 2026 大会上 华为正式发布 HarmonyOS 7 开发者 Beta 版——业内首个完成 AI 化改造的操作系统,鸿蒙智能向 Agent 架构全面演进,搭载 openPangu 2.0(Pro 505B / 激活 18B)。同日 月之暗面 Kimi 推出全球首张 AI 原生信用卡,每一笔消费直接转化为 AI 算力额度。第八届北京智源大会也在今天开幕,院长王仲远宣布 AI 范式从"Next Token Prediction"演进到"Next State Prediction"。国际市场,OpenAI 据报正考虑大幅 token 降价以应对 Anthropic 的强势追赶(Anthropic 5 月年化收入已达 $47B,首次在企业采用率上反超 OpenAI)。
趋势1:操作系统级 Agent 竞赛全面爆发 趋势2:AI 商业模式从订阅制向"消费即算力"延伸 趋势3:物理世界建模正在取代纯文本预测成为新范式
🌍 国际动态
1. OpenAI 据报正考虑大幅 token 降价,应对 Anthropic 强势追赶
事件简述:WSJ 6 月 11 日独家报道,OpenAI 内部正在权衡对 API token 价格做"剧烈下调",以阻止企业客户进一步流向 Anthropic。这是 OpenAI 在 Anthropic 完成 5 月 $47B 年化收入(15 个月 30 倍增长)后的被动应对——Ramp AI Index 5 月数据显示,Anthropic 商业采用率 34.4% 首次反超 OpenAI 的 32.3%。同时 OpenAI 与 Anthropic 均已向 SEC 保密提交 S-1,估值都指向约 $1 万亿;Anthropic 5 月完成的 $965B 估值 Series H 略胜 OpenAI 3 月 $852B 估值。
关键数据:Anthropic 年化收入 15 个月 30x 增长至 $47B;OpenAI 同期仅从 $13B 增至 $24-25B;Claude Fable 5(6/9 发布)定价 $10/$50 每百万 token,比 Mythos Preview 便宜 50%,且 SWE-Bench Pro 跑分 80.3% vs GPT-5.5 的 58.6%。
影响分析:token 价格战在 2026 年中正式开打。OpenAI 的"降价 + IPO 募资"双线打法意味着接下来 3-6 个月开发者将看到 API 价格普降 30-50%。但 Anthropic 已经通过 Fable 5 把"性能 / 价格"比拉到 22 个百分点的代差,价格战可能演化为"推理能力 + 长上下文 + 安全可控"的全方位军备竞赛。
📅6月11日
2. SpaceX 将孟菲斯 Colossus 1 整座数据中心全租给 Anthropic
事件简述:财联社 6 月 13 日凌晨援引报道,SpaceX 在用孟菲斯 Colossus 1 数据中心训练与运行 Grok 模型时遭遇重大技术挑战,决定将该数据中心全部容量转租给 Anthropic。Colossus 1 是 SpaceX 旗下 xAI 在 2024 年建成的旗舰超算集群,专为训练 Grok 系列模型设计。此次转租发生在 SPCX 上市仅一天之后,意味着马斯克首次承认 Grok 训练遇到了"非自研算力栈"难以解决的基础设施瓶颈。
关键数据:Colossus 1 是 xAI 历史上最大单笔算力投资;Anthropic 5 月已签下 1GW 数据中心租约并寻求 Google $200B 5 年云合作,本次叠加 Colossus 1 后其可用算力体量将进一步逼近 OpenAI 水平。
影响分析:xAI 算力路线从"全栈自研"被迫转向"算力换合作",对 Grok 5 训练时间表影响巨大。Anthropic 则在 IPO 之前完成了"算力锚定"——手握 Google Cloud + 1GW 自有 + Colossus 1 三层算力池,是 Fable 5 之后 Claude 系列推理价格继续下调的底气所在。
📅6月13日
3. Google DeepMind 发布 DiffusionGemma:26B MoE 4 倍速开源文本生成模型
事件简述:Google 官方博客 6 月 10 日宣布开源 DiffusionGemma——基于 Gemma 4 26B MoE(激活 3.8B)的实验性文本扩散模型。区别于主流自回归(autoregressive)逐 token 生成,DiffusionGemma 采用文本扩散(text diffusion) 范式,每个 forward pass 并行生成 256 个 token,把"显存带宽"瓶颈转换为"算力"瓶颈,在单卡 H100 上实现 1000+ tokens/sec、RTX 5090 上 700+ tokens/sec——比同体量自回归模型快 4-5 倍。
关键数据:26B 总参数 / 3.8B 激活;双向注意力(bi-directional attention);Apache 2.0 协议;18GB 显存可量化运行;同步登陆 Hugging Face、Kaggle、Vertex AI Model Garden;自回归 Gemma 4 仍为高质量生产首选,DiffusionGemma 定位"速度优先"的本地交互场景(在线编辑、快速迭代、非线性文本结构)。
影响分析:扩散式文本生成并不是新概念(GPT-3 时代就被 LLaDA 等研究探索过),但 DeepMind 是首次把它推到"26B 主流尺寸 + 4x 加速 + 开源 + 多平台首发"的工程化阶段。这很可能成为端侧 LLM(手机 / 笔记本 / 嵌入式设备)的新基准——把"快到 1000 tok/s"拉到消费级 GPU 可触达的范围,让"无网络实时 LLM 助手"成为可能。
📅6月10日
🇨🇳 国内动态
1. 华为发布 HarmonyOS 7 开发者 Beta 版:业内首个完成 AI 化改造的操作系统
事件简述:6 月 12 日华为开发者大会 2026(HDC 2026)在东莞松山湖开幕,余承东正式发布 HarmonyOS 7 开发者 Beta 版——华为称之为"业内首个完成 AI 化改造的操作系统"。核心信号是鸿蒙从"原生 AI OS"进一步推向"Agent OS":Agent 亲和系统架构 + 鸿蒙智能体框架 2.0(HMAF 2.0)+ 系统智能体小艺构成完整三件套;openPangu 2.0 提供 Pro(505B / 激活 18B)和 Flash(92B / 激活 6B)两个版本,均支持 512K 长上下文,6 月 30 日起将陆续开源 7 大组件;端侧 30B 模型已经落地。
关键数据:HarmonyOS 6 终端设备 6600 万台、注册开发者 1100 万、应用市场可获取应用和服务 40 万+;HarmonyOS 7 复杂任务成功率 超 90%;性能较 6 提升 15%,年度负载增长 <10%;Mate90 系列首发,秋季发布。
影响分析:当苹果的 Siri AI 仍停留在"嵌入既有 App Store 生态"、Google 把 Android 重命名为"智能系统"、华为直接把整个 OS 改造为 Agent 调度平台时,操作系统级 Agent 竞赛已经进入白热化。"意图即服务 + Skill 化 + 跨设备协同"是鸿蒙对 iOS 27 / Android 16 的差异化答案——但鸿蒙的成败仍取决于海外应用生态能否在 1-2 年内跟上。
📅6月12日
2. Kimi 推出全球首张 AI 原生信用卡:消费即算力,Token 与积分双向流通
事件简述:6 月 12 日,月之暗面 Kimi 宣布 全球首张 AI 原生信用卡"Kimi 信用卡"正式开启预约,7 月正式发行。这张卡与一家大型国有银行联合发行、由一家国际卡组织提供全球支付网络——持卡人每一笔消费均按规则转化为 AI 算力额度,可直接兑换 Agent 使用额度、高级功能权限、最新模型内测资格等。同日,招商银行为其去年发行的"运通工程师信用卡"上线"专属 AI Plan"权益,意味着银行已经把"AI 权益"当成信用卡核心卖点来运营。
关键数据:当前头部国产大模型付费用户月均消费仅 30-80 元;Kimi 已拆除 VIE 架构,估值 超 $200 亿冲刺港股 IPO;Kimi 信用卡为"全球首张将 AI 服务纳入核心权益体系的实体信用卡"。
影响分析:Kimi 信用卡的真正价值不是"支付 + AI"叠加,而是探索 Token 与信用卡积分双向互通——AI 数字权益和传统金融积分体系第一次实现了双向兑换。这等于让"算力成为流通货币",也意味着 AI 公司的商业模式从单一订阅制走向"算力零售"。当"消费即算力"成为现实,AI 应用可以反向拉动信用卡活跃度,银行则拿到了"覆盖科技用户"的新流量入口——三方共赢但也面临合规、汇率、用户隐私三重新挑战。
📅6月12日
3. 第八届北京智源大会开幕:王仲远宣布 AI 范式从 Next Token Prediction 转向 Next State Prediction
事件简述:6 月 12-13 日,第八届北京智源大会在中关村国际创新中心开幕,200 余位顶尖学者、40 余位 AI 企业 CEO 及联合创始人 齐聚一堂。本届大会聚焦 Agent、世界模型、具身智能、AI 自进化与 AI 安全等 20+ 专题论坛。开幕主旨演讲中,智源研究院院长王仲远宣布:随着 Next Token Prediction 研发进入深水区,AI 正在发生重大范式变革——从 Next Token Prediction 演进到 Next State Prediction / Next Physical State Prediction。"早年大语言模型处理的是文字,多模态模型开始引入图像、音频、脑信号,接下来要解决的就是真实物理空间的时间、空间、物理规律、物理常识。"
关键数据:本届大会 12 位图灵奖得主之一;2026 智源大会特设"世界模型论坛"(6/13 全天)、"Agent for Science 论坛"(6/13 全天)、"终端智能体与 OpenClaw 论坛"三大主题论坛;逆矩阵、极佳视界、蚂蚁灵波、自变量机器人、腾讯混元 3D 等世界模型方向代表企业悉数到场。
影响分析:智源大会与同期 HDC 2026、Kimi 信用卡形成"中国 AI 三连击",背后是同一条主线——当 Transformer 范式逼近"预测下一个 token"的天花板,AI 必须向"预测物理世界下一个状态"迁移。这与 Yann LeCun 的 JEPA、DeepMind 的 Genie 3、世界模型在 2025-2026 全面爆发完全同频。中国的差异化路径是"学术 + 产业 + 政策"三方协同推进世界模型标准化与开源生态。
📅6月12日
📄 今日论文
1. SpatialClaw: Rethinking Action Interface for Agentic Spatial Reasoning
作者:Seokju Cho, Ryo Hachiuma, Abhishek Badki et al. | 机构:NVIDIA 等
核心贡献:当前 VLM 空间推理的主流范式是"工具增强 Agent"——为 VLM 拼接视觉感知 / 深度估计 / 相机姿态估计等专精模块,但模块间接口松散、对真实 3D 几何理解贡献有限。SpatialClaw 提出统一动作接口:把空间推理重新建模为"由 VLM 直接驱动一系列针对 3D 几何的细粒度动作"(旋转、平移、缩放、子图切片),并把动作空间嵌入到训练循环中,让模型学会"像人一样探索 3D 场景",而不是一次性给出答案。
为什么重要:这是 6 月 12 日华为"Agent OS"思路在空间智能方向上的同频——下一代 AI Agent 不只是调用工具,而是要能在 3D 物理空间中"主动操作"。SpatialClaw 给出的接口设计可能成为机器人 / 具身智能 / AR-VR 的标准动作层。
📄 arXiv:2606.13673 📅6月11日
2. Agents-K1: Towards Agent-native Knowledge Orchestration
作者:Zongsheng Cao, Bihao Zhan, Jinxin Shi et al.
核心贡献:现有 LLM 科研 Agent 在"任务编排"上已经成熟,但严重忽视了"科学知识编排"——把论文简化成摘要 + 表面提及 + 扁平引用边,丢失了实体、断言、证据、机制、方法链路等关键结构。Agents-K1 提出Agent-native 知识编排:让科研 Agent 在执行检索 / 阅读 / 综合任务时主动构建"知识图谱工作区",把多篇论文的结构化信息(claims、evidence、methods、mechanisms)按实体对齐后再做综合,显著优于"摘要+引用"的扁平化做法。
为什么重要:这与智源大会"Agent for Science 论坛"主题直接呼应。当 OpenAI Deep Research / Claude Research / Kimi 深度研究 都在拼"研究 Agent",真正的护城河是底层的知识编排能力——能否把碎片化文献融合成可追溯、可验证的知识网络,决定了 AI for Science 的上限。
📄 arXiv:2606.13669 📅6月11日
3. EurekAgent: Agent Environment Engineering is All You Need For Autonomous Scientific Discovery
作者:Amy Xin, Jiening Siow, Junjie Wang et al.
核心贡献:提出 EurekAgent 框架,核心论点是——LLM 科研 Agent 的瓶颈不在模型能力,而在"环境工程":环境的状态空间、奖励信号、可验证性、可重复性。论文展示了如何把一个科研任务的工作环境(数据集 / 评测指标 / 工具 / 验证器)工程化封装好之后,主流 LLM Agent 就能在其中自动提出、验证、迭代科学方案,且在多项材料 / 蛋白质 / 机器学习优化任务上反超人类设计的方案。
为什么重要:EurekAgent 与 Agents-K1、SpatialClaw 同一天提交,呈现出一个清晰的"Agent 操作系统化"研究浪潮——基础设施(环境、动作接口、知识图谱)的工程化水平,比单一模型智能更重要。这与华为 HDC 2026 提出的"Agent 亲和系统架构"是同一种范式迁移。
📄 arXiv:2606.13662 📅6月11日