【AI 日报】豆包 2.1 Pro 跨越"生产级质变点",日均 Token 突破 180 万亿

🔦 今日速览

字节火山引擎 6 月 23 日 FORCE 大会发布豆包旗舰模型 Doubao-Seed 2.1 Pro,首次让国产大模型连续 18 小时自主跑通芯片 RTL 设计全流程,综合使用成本较 Claude Opus 4.6 降低近 80%,日均 Token 调用量突破 180 万亿(两年涨 1500 倍)——这是国产大模型首次在 Coding、Agent、VLM 三大维度同时跨越"生产级质变点"。同日,ISC.AI 2026 互联网安全大会在北京开幕,聚焦"人对人"到"AI 对 AI"安全范式变革,周鸿祎判断 2026 年将是"百亿智能体之年"。海外端,Anthropic Claude Fable 5 结束 13 天免费试用窗口,转入按使用付费;Google Gemini 3.5 Pro GA 窗口(6/23-6/30)正式开放,2 百万 token 上下文为当前生产前沿模型最大。

趋势 1:国产大模型在 Coding/Agent 双线逼近闭源旗舰 趋势 2:AI 代理人平台化进入"白热化竞速" 趋势 3:Agent 时代倒逼安全范式从"人对人"转向"AI 对 AI" 趋势 4:全球 AI 资本向主权基金与算力代币集中

🌍 国际动态

1. 字节豆包 2.1 Pro 跨越"生产级质变点",日均 Token 180 万亿登顶中国 MaaS

事件简述:6 月 23 日火山 FORCE 原动力大会,字节正式发布豆包 Doubao-Seed 2.1 Pro,多项基准对标 GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro。发布会上展示了一项芯片设计 RTL 测试——模型连续运行近 18 小时、经历 9 轮迭代,自主跑通仿真、测试等完整工程流程,首次让国产模型在长周期工程交付上端到端可用;同日首次亮相豆包视频生成模型 Seedance 2.5,预计 7 月全量上线,30 秒单条视频一次性生成+参考素材上限从 12 份提升至 50 份。

关键数据:豆包日均 Token 调用量 180 万亿,较 2024 年 5 月 1200 亿初始规模两年间涨 1500 倍;在中国公有云 MaaS 市场份额达 49.5%;综合使用成本较 Claude Opus 4.6 降低近 80%;Seedance 2.0 单月营收破 10 亿、年化 ARR 143 亿、毛利率 70%;年 Token 调用量超 1 万亿的企业已达 200 家。

影响分析:Seedance 2.0 的盈利状况与 OpenAI Sora 持续亏损形成鲜明对比,意味着国产 AI 视频已完成"商业化正循环"——短剧、品牌 B 端客户成为关键支点;而 2.1 Pro 的 18 小时自主工程交付,则让国产大模型在 Coding/Agent 双线正式跨过"生产级质变点",改写"国产大模型长逻辑、工程交付有短板"的旧叙事。

📅6月23日

2. Anthropic Fable 5 结束 13 天免费试用,转按使用付费;Gemini 3.5 Pro GA 窗口开放

事件简述:6 月 23 日,Anthropic 宣布 Claude Fable 5 不再包含在 Pro/Max/Team/Enterprise 订阅中,结束 6 月 9 日发布时承诺的 13 天免费窗口;因 6 月 12-18 日美国出口管制导致订阅者实际仅享 4-5 天免费。新定价:API 输入 $10/百万 token,输出 $50/百万 token(双倍 Claude Opus 4.8)。同日 Google Gemini 3.5 Pro GA 窗口(6/23-6/30)正式开放,已确认2 百万 token 上下文为当前生产前沿模型最大,Deep Think 推理模式仅 $250/月 Ultra 订阅可用,预估定价 $15/百万输入、$60/百万输出。

关键数据:Fable 5 禁令第 10 天(尚未完全恢复);Gemini 3.5 Pro 已 12 天未公布 GA 时间,若 6 月 30 日前仍未发布将是 Google 连续第二次 I/O 承诺未兑现;Anthropic 同期被传"AI 驱动 AI 递归自进化"内部策略曝光,智库发文提议全球"共同暂停"研发机制。

影响分析:Fable 5 收费化与禁令叠加,付费用户 fallback 已开始从 Opus 4.8 永久迁移到 GPT-5.6/Gemini 3.5——而 Gemini 3.5 Pro 2M 上下文是 Anthropic 现有产品线难以对位的"代差级"能力,Anthropic 在 API 市场的"长上下文壁垒"被实质性击穿。Anthropic 的"共同暂停"提议则更像是为 IPO 估值叙事上"安全溢价"。

📅6月23日

3. OpenAI 启动"Patch the Planet"计划 + 收购 Astral 工具链

事件简述:OpenAI 联合安全公司 Trail of Bits 启动 "Patch the Planet" 计划,利用 GPT-5.5-Cyber 协助开源项目发现和修复漏洞——第一周覆盖 19 个关键开源项目(Python、Go、cURL 等),发现数百个安全问题,合并 37 个补丁;成果包括一天内搭建完整 fuzzing 实验室(人工需 2-3 周)、发现 OpenBSD 内核中 23 年历史的 use-after-free 漏洞。同期 OpenAI 宣布收购 Astral,获得 uv(Rust 编写、比 pip 快 10-100 倍的 Python 包管理器)和 ruff(已替代 flake8/black 的 linter)两大事实标准工具,直接控制 Codex 工具层。

关键数据:uv 在大型项目中比 pip 快 10-100 倍;ruff 已替代至少 3 款传统 Python 工具;OpenBSD 漏洞已存在 23 年,横跨 OS 多个版本。

影响分析:OpenAI 一天内的工作量相当于传统安全团队 2-3 周——AI 在安全攻防两端(攻击方、防御方)同时进入"产能爆炸"阶段,Trail of Bits 工程师直言"找漏洞已成为最简单的部分";而 Astral 收购则把 AI 编程战争从"模型谁更强"扩展到"开发者工具链谁拥有",Apache 2.0 协议延续性成为开源社区关注焦点。

📅6月23日

4. 谷歌云大会发布 AI 代理人工具套件,SPCX 单日跌 10%

事件简述:6 月 22-24 日,Google Cloud Next 2026 在拉斯维加斯举办,Google 发布整套 AI 代理人构建工具——支持创建代理人并追踪其在企业内部运行情况,含一个专用于虚拟机器人发布资讯和进度报告的收件匣,并更新 Workspace 生产力套件。同日 SpaceX(SPCX)单日跌 10%,为上市以来最差单日,市场担忧 Cursor 收购整合期与 Anthropic+Google 算力合同的稳定性。Cursor 2026 年估值据报已达 1300 亿美元。

关键数据:Google 2026 年 AI 投入 $1850 亿;即将发布新一代客制化推理专用芯片,在半导体领域进一步挑战英伟达;SPCX 自 IPO 以来已锁定 Anthropic+Google 每月 AI 算力合同 $21.7 亿(其中 Google-SpaceX 占 $9.2 亿/月);Meta 与依视路陆逊梯卡同日发布起售价 $299 的 Meta Glasses 智能眼镜新系列(较第二代便宜 $80+)。

影响分析:Google 试图凭借"芯片+模型+开发者工具"组合优势在企业 AI 代理人市场与 OpenAI/Anthropic 正面竞争,但当前企业开发者实际在 Claude Code/Codex 之间高频切换,Google 仍被边缘化——这一代 AI 编程工具"Google 缺位"是 Sundar Pichai 2026 年最大的战略隐痛;SPCX 单日跌 10% 则反映市场对"AI 巨头并购"模式的短期审美疲劳。

📅6月22-24日

5. 阿布扎比 MGX 募资 500 亿美元,全球最大 AI 投资工具诞生

事件简述:财联社 6 月 24 日报道,阿布扎比人工智能投资公司 MGX 已从中东地区及全球投资机构手中筹集近 500 亿美元,用于加速 AI 基础设施和技术领域投资。资金来源包括区域主权财富基金、全球养老金基金和大型机构投资者,基金已完成关闭并开始投资。

关键数据:500 亿美元规模——按规模将成为全球历史上最大的专注于人工智能的投资工具之一;标志着长期作为资本输出方的阿布扎比首次利用其国际网络在大规模上向外部募集资金,将巨额石油财富转化为对未来科技的长期影响力。

影响分析:MGX 的"500 亿美元 AI 投资工具"把 AI 资本从 VC/PE 主导推向"主权基金 + 养老金"主导阶段;与同期阿联酋 Rezolve AI 合作(Visa 全数字化卡关联优惠)、马斯克 xAI 解散并入 SpaceX 形成共振——意味着 AI 算力 / 基础模型 / Agent 平台的"国家队入场"窗口已正式打开,中美之外的"第三极"资本正在形成。

📅6月24日

🇨🇳 国内动态

1. 影眸科技完成数亿融资,发布 Rodin Gen-2.5 千万面级 3D 生成模型

事件简述:6 月 23 日,3D 原生生成厂商影眸科技完成新一轮数亿元融资,凯辉基金、上海国投先导联合领投,光源资本担任独家财务顾问,资金全部用于 3D 大模型技术研发与全球商业化落地。同步上线 Hyper3D Rodin Gen-2.5——业内首款千万面级 AI 三维生成工具,借鉴大语言模型"先思考再生成"逻辑重构生成链路,最快 4 秒就能产出百万面高精度模型,配套 12K 原生 PBR 贴图。

关键数据:支持文生、图生、多视角参考生成,输出 GLB、FBX 等工业通用格式,无需二次修复即可投入游戏、电商建模、工业设计、具身智能仿真等场景;企业客户覆盖字节、Unity、Canva 等海内外大厂,英伟达 CES 大会机器人演示所用 3D 素材均由该模型生成;海外业务收入占整体 80%;上线首月平台订阅用户与 ARR 营收环比增幅均突破 400%;2032 年全球 3D AI 市场规模预计突破 75.9 亿美元。

影响分析:在 Vast、Meshy 等海外产品与字节 Seed3D、阿里 ABot-Earth 等国产产品同台竞争的格局下,影眸依靠"原生三维技术"(而非 2D 转 3D 路线)构筑差异化壁垒,本轮融资将助力国产 3D 大模型持续抢占全球市场份额;具身智能仿真、企业级数字资产等场景将率先受益于"工业级可用"的高精度 3D 生成。

📅6月23日

2. DeepSeek 新设 Harness 组,布局 Agent 基础设施

事件简述:6 月 23 日,DeepSeek 新成立的 Harness 组正在加大招聘力度,负责人崔添翼公开发帖招募 Harness 研究员、工程师及产品经理。Harness 组目标为"Model + Harness = Agent",围绕 Agent 产品的上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent、真实任务反馈和用户反馈优化等方向展开。

关键数据:这是 DeepSeek 在 5 月完成 74 亿美元首轮外部融资(估值 500 亿美元)后的首个组织级重大调整;同期 DeepSeek V4.1 计划 6 月发布,新增图像和音频理解能力。

影响分析:DeepSeek 此举标志着中国头部模型厂商在"基础模型 + Agent 工具链"分工上的首个明确信号——Harness 层(Agent 运行时框架、上下文/记忆管理、Subagent 协作)开始被视为独立的产品化方向,而不是简单绑定到模型 API。这与 OpenAI Agents SDK、Anthropic Claude Agent SDK、腾讯云 EdgeOne Makers 同日发布形成共振,Agent 基础设施正在从"模型附庸"升级为独立赛道。

📅6月23日

3. 智谱 GLM-5.5 预计 8 月发布,万亿参数冲击全球顶尖

事件简述:6 月 23 日行业消息显示,智谱 AI 计划今年 8 月推出新一代基座 GLM-5.5,预估总参数量突破万亿,相比当前开源 GLM-5.2(7440 亿总参)容量提升超 50%。

关键数据:即将上线 GLM-5.5 基于升级 MoE 混合专家架构,长上下文推理、多模态理解、复杂科研任务能力全面迭代;此前美国限制 Claude Fable 5/Mythos 5 全球访问后,智谱快速开源 GLM-5.2 填补市场空白,该模型在 SWE 编程榜单稳居开源第一;6 月 23 日智谱港股大跌 10.0%(累计一周仍暴涨)。

影响分析:智谱此前在 X 平台公开回应马斯克"中国大模型何时达到 Fable 级别"问题——"不需要那么久"。GLM-5.5 万亿参数版本将重点攻克长周期自主智能体、生物医药、材料科学等高难度场景,与 DeepSeek Harness 组、阿里 Qwen 全面开源、字节豆包 2.1 Pro 形成"国产模型全员上探"格局。

📅6月23日

4. 京东开源 JoyAI-VL-Interaction,百川 Baichuan-M4 拿下 HealthBench 三项第一

事件简述:6 月 23 日,京东正式开源全球首个全栈实时影音视觉语言交互模型 JoyAI-VL-Interaction,获 vLLM-Omni 深度支持,模型可自主观察影音流并判断介入时机,为安防、直播、操作指导等场景提供即时交互能力。同日百川智能与清华大学联合推出医疗增强大模型 Baichuan-M4,在 HealthBench 上斩获三项世界第一,综合分 68.6 领先 GPT-5.5 超 10 分,事实性幻觉率低至 3.3%。

关键数据:JoyAI-VL-Interaction 是全球首个"全栈实时"模型,意味着从感知→判断→介入的整个循环在单一模型内完成;Baichuan-M4 SCAN-bench 动态评测初诊得分接近 80%,展现主动问诊的临床思维能力。

影响分析:京东与百川的同日发布,标志着中国大模型竞争从"Coding/Agent 通用赛道"扩展到"垂直行业 + 多模态实时交互"——医疗、电商直播、安防等场景的"模型即产品"时代正式到来;百川 HealthBench 三项第一对 GPT-5.5 的领先超过 10 分,是国产医疗 AI 首次在权威国际评测上系统性超越海外旗舰。

📅6月23日

5. 港股大模型板块重挫,MINIMAX 单日跌 16.5%;ISC.AI 2026 开幕聚焦"AI 对 AI"安全范式

事件简述:6 月 23 日港股明显下挫,恒生科技指数跌 3.30% 报 4399.22 点,AI 及大模型产业链大幅回调。MINIMAX-W 大跌 16.5%(7 月 9 日将迎来首批股份解禁),智谱大跌 10.0%,五一视界跌 15.1%,云知声跌 14.4%。同日 6 月 24 日,第十四届互联网安全大会(ISC.AI 2026)在北京国家会议中心举办,主题聚焦"人对人"到"AI 对 AI"安全范式变革。

关键数据:全日成交额 3343.61 亿港元,南向资金净买入 103.71 亿港元;360 集团创始人周鸿祎此前判断 2026 年将是"百亿智能体之年",行业转型焦点正从"模型能力比拼"转向"实际落地效能";大会设 2 场未来峰会、24 小时 Agent Teams 沉浸式体验展、3 场创新赛事及 20 余场行业垂直论坛;360 将展示漏洞挖掘智能体、渗透测试智能体等最新成果。

影响分析:MINIMAX 7 月 9 日首批股份解禁是当日 16.5% 跌幅的核心催化,但"5 天涨出一个中国电信"后的获利回吐同样不可忽视;ISC.AI 2026 把"安全对抗"从传统"人对人"升维到"AI 对 AI",意味着攻防两端同步进入智能体时代——智能体既是新的权限入口与数据节点,也是新型攻击面。这是中国安全行业对 Agent 时代安全范式的首次系统化框架。

📅6月23-24日

📄 今日论文

1. Tapered Language Models: 重新设计 LLM 层级参数分配

作者/机构:Reza Bayat, Ali Behrouz, Aaron Courville 等 | Mila/蒙特利尔大学 核心贡献:现代语言模型(Transformer/Recurrent/Memory-based)共用一个"层叠式同构"底盘——每一层参数、宽度、注意力配置都一致。本研究首次系统证明这种"均匀分配"并非最优,提出"锥度化"(Tapered)架构,允许参数量、宽度、注意力头数在层级间平滑伸缩,在同等总参数与训练成本下,SOTA 语言建模困惑度(perplexity)显著降低。 为什么重要:如果"锥度化"被验证为通用规律,所有头部模型(GLM-5.5、GPT-5.6、Gemini 3.5 Pro)的预训练配方都需要重写——"每层 80B 参数"的同构假设在 Scaling Law 时代被默认接受 7 年,本文是这个范式的首个真正挑战者。 📄 arXiv:2606.23670 📅6月22日

2. CoorDex: 协调身体与双手先验的连续灵巧人形机器人操作

作者/机构:Sikai Li, Shuning Li, Zhenyu Wei 等 | 多机构联合 核心贡献:人形机器人 loco-manipulation(运动+操作)通常被简化为"走-停-走"分段流程,机械手自由度(DoF)也局限于"开-合"抓取基元。CoorDex 提出身体-手部先验的联合学习框架,实现连续 loco-manipulation——机器人在行走过程中同步完成双手操作,无需中途停顿。在仿真环境复杂灵巧任务上,任务成功率较分段基线提升 30%+。 为什么重要:6 月具身智能融资潮(影眸、DeepSeek Harness 组、9 所高校新增本科专业)+ Optimus Gen-3 叠衣服演示,让"具身智能 GPT 时刻"逼近。CoorDex 把"开-合"基元升级为"连续灵巧操作",为 Optimus/Telsa/Figure/宇树等所有人形机器人提供新一代运动-操作控制方案。 📄 arXiv:2606.23680 📅6月22日

3. AIR: 多模态大模型的自适应代码交错推理

作者/机构:Cong Han, Xiaohan Lan, Haibo Qiu 等 | 多机构联合 核心贡献:继 OpenAI o3 之后,MLLM(多模态大模型)的"代码交错推理"成为前沿方向——让模型在推理过程中生成可执行代码来辅助视觉感知。现有工作主要集中在"工具调用 → 视觉感知"链路上,本研究首次提出"自适应"机制:模型根据任务难度自适应决定何时生成代码、何时直接推理,避免简单任务被强制走代码路径(导致过度延迟与算力浪费)。

为什么重要:字节豆包 2.1 Pro 18 小时自主跑通 RTL 设计、Dropbox Nova 1/12 PR 由 Agent 生成——这些都依赖"代码交错推理"。AIR 把"是否走代码"从硬编码升级为模型自适应决策,对所有 MLLM 厂商(豆包、Qwen-VL、GPT-5.6、Gemini 3.5 Pro)的 Agent 化路径有直接工程价值。 📄 arXiv:2606.23678 📅6月22日

4. Randomized YaRN: 改进长上下文推理的长度泛化

作者/机构:Manas Mehta, Fangcong Yin, Greg Durrett 等 | UT Austin 核心贡献:YaRN(Yet another RoPE extensioN)是当前最主流的长上下文扩展技术,但其长度泛化(在超出训练长度的位置仍能保持性能)能力有限。本文提出Randomized YaRN——在训练阶段对上下文位置做随机扰动,显著改善模型在超出训练长度 8-16 倍时的位置推理鲁棒性,在多个长上下文推理基准(L-Eval、LongBench、∞Bench)上一致超越 vanilla YaRN。

为什么重要:Gemini 3.5 Pro 把上下文推到 200 万 tokens、Qwen3.6-Plus 默认 1M tokens——长上下文已成为旗舰标配。但"长 ≠ 准",现有模型在超出训练长度的位置常出现"位置感知衰减"。Randomized YaRN 提供了一个无需重新预训练的"长上下文质量增强"方案,对所有追求长上下文的厂商(OpenAI、Anthropic、智谱、阿里)都有直接借鉴价值。 📄 arXiv:2606.23687 📅6月22日