【AI 日报】OpenAI发布Dreaming V3，ChatGPT记忆能力全面升级

🔦 今日速览

OpenAI于6月4日推出Dreaming V3自动记忆系统，彻底取代旧版"手动保存记忆"，ChatGPT首次实现跨对话自动 synthesize 用户偏好与上下文。同日，SpaceX定档IPO发行价$135，将以$1.75万亿估值创下全球最大IPO纪录，为AI公司公开市场融资树立新标杆。此外，DeepSeek首次登顶美国企业软件趋势榜单，美国公司正直接付费使用中国模型。

趋势1：AI产品从"工具"转向"长期助手"，记忆成为核心竞争力 趋势2：AI超级IPO潮开启，SpaceX、Anthropic、OpenAI集体冲刺公开市场 趋势3：中国开源模型加速渗透美国企业，成本驱动替代效应显现

🌍 国际动态

1. OpenAI发布Dreaming V3，ChatGPT记忆能力全面升级

事件简述：OpenAI于6月4日正式推出Dreaming V3——一套独立的自动记忆合成系统，彻底取代2024年4月上线的"Saved Memories"手动记忆功能。新系统通过后台进程持续从多轮对话中自动提炼用户偏好、约束条件和长期项目背景，无需用户再显式输入"请记住"。它还能动态更新记忆（例如将"计划7月去新加坡"自动更新为"2026年7月已去过新加坡"），确保上下文始终新鲜、准确。 关键数据：Plus和Pro用户首批在美区上线；Free用户即将在"未来数周"获得该功能；OpenAI表示近期优化使Free用户的Dreaming计算成本降低了约5倍；记忆容量也将为Plus/Pro用户扩容。 影响分析：Dreaming V3标志着ChatGPT从"每轮重新开始的聊天机器人"真正进化为"持续陪伴的长期助手"。记忆能力将是下一代AI助手区分高下的核心战场，Google、Anthropic等产品将面临直接压力。 📅6月4日

2. OpenAI升级GPT-Rosalind生命科学研究模型

事件简述：OpenAI于6月3日发布GPT-Rosalind的重大更新，这是其专为生命科学领域打造的系列模型，结合了GPT-5.5的Agentic编码与工具使用能力，并在药物化学、基因组学和湿实验辅助方面显著增强。OpenAI同时推出了LifeSciBench基准测试，覆盖从文献证据提取、实验设计到FDA监管沟通的六大真实科研流程。该模型目前已向Amgen、Moderna、Allen Institute、Thermo Fisher Scientific等合作伙伴开放研究预览。 关键数据：在药物化学基准MedChemBench上，GPT-Rosalind准确率达到27.5%（GPT-5.5为25.1%）；在基因组学基准GeneBench上达到21.6%（GPT-5.5为20.4%）；在真实湿实验协议辅助基准LabWorkBench上达到63.2%（GPT-5.5为55.8%），同时token效率提升最高达31%。 影响分析：OpenAI正从通用聊天工具向垂直科学领域深度渗透。GPT-Rosalind在FDA监管文件审阅、分子克隆方案设计等高门槛场景中的表现，意味着AI正在进入需要严格合规和实验验证的核心科研环节。 📅6月3日

3. SpaceX定档IPO发行价$135，估值$1.75万亿创历史纪录

事件简述：SpaceX于6月3日正式确定IPO发行价为每股135美元，计划发行5.556亿股，募资规模达750亿美元，公司估值高达1.75万亿美元。这将超越2019年沙特阿美IPO（估值1.7万亿美元、募资290亿美元），成为人类历史上规模最大的首次公开募股。SpaceX计划于6月12日在纳斯达克挂牌交易，股票代码为SPCX。值得注意的是，马斯克直接跳过了华尔街传统的"询价区间"环节，单方面宣布了最终定价。 关键数据：发行555.6百万股 | 募资750亿美元 | 估值1.75万亿美元 | 较2月自估值1.25万亿美元高出40% | 马斯克控制的约50%股权价值超7520亿美元 | 计划将高达30%的股份分配给散户投资者。 影响分析：SpaceX的IPO是2026年AI资本市场"超级IPO潮"的第一枪。Anthropic已于6月1日秘密提交IPO申请，OpenAI也预计将在数周内跟进。三大AI/航天巨头的集体上市，标志着AI行业从风险资本驱动全面转向公开市场驱动，也将释放数千亿美元的硅谷财富。 📅6月3日

4. Meta缩减员工鼠标与键盘追踪计划

事件简述：在遭遇数周激烈内部反弹后，Meta于6月2日通过VP Stephane Kasriel向员工发送备忘录，宣布缩减其极具争议的AI训练数据收集计划。该计划原本在员工工作电脑上追踪鼠标移动、点击和键盘输入以训练AI Agent。新调整包括：员工可单次暂停数据收集长达30分钟，并可申请豁免；同时团队优化了软件以降低对家庭网络流量和电池寿命的消耗。此前员工抱怨该软件导致家庭网络流量激增，并将其比作"员工数据提取工厂"。 关键数据：单次最长暂停30分钟 | 追踪范围覆盖鼠标移动、点击、键盘输入及偶发截屏 | 软件归属Meta Superintelligence Labs部门。 影响分析：这起事件揭示了AI公司在获取高质量行为数据时面临的伦理与员工信任危机。Meta的妥协表明，即便在激烈的AI Agent竞赛中，"无底线收集数据"的推进策略也会遭遇组织内部的强硬阻力。 📅6月2日

5. DeepSeek登顶美国企业「趋势软件」榜单

事件简述：根据纽约企业支出平台Ramp发布的6月4日报告，DeepSeek首次登上其"趋势软件供应商"榜单榜首，领先于活动管理平台PheedLoop和开源模型服务平台Fireworks AI。更值得注意的是，Ramp首席经济学家Ara Kharazian指出，美国企业正在向DeepSeek直接付费，意味着它们正通过DeepSeek的中国服务器直接收发数据，而非在本地部署其开源模型。这被视为美国企业为寻找OpenAI和Anthropic更便宜替代方案而采取的突破性举措。 关键数据：DeepSeek在4月的美国企业采用率仍仅为0.1%，而Anthropic和OpenAI分别占34.4%和32.3%；但Ramp未披露6月最新市占率数据。 影响分析：这是中国企业AI模型首次以"SaaS服务"形态直接获得美国企业付费，地缘政治与成本压力的交织正在重塑全球AI供应链。DeepSeek的崛起也为其他中国模型出海提供了可复制的商业路径。 📅6月4日

🇨🇳 国内动态

1. 华为昇腾950PR性能突破，国产AI芯片市占率首超五成

事件简述：据6月2日新浪新闻分析报道，华为昇腾950PR芯片在2026年第一季度实现量产并大规模交付后，国产AI芯片在中国市场的合计份额首次突破52.3%，其中昇腾以37%的份额位居第一。950PR单卡推理性能达到英伟达H20的2.87倍，FP8算力突破1 PFLOPS，部署成本仅为英伟达同级别方案的1/3。腾讯、阿里、字节等头部企业已全面采用"昇腾+寒武纪"双供应商策略，DeepSeek V4等国产大模型也已完成从CUDA向华为CANN框架的迁移。 关键数据：国产AI芯片Q1市占率52.3% | 昇腾市占率37% | 英伟达份额从2019年95%暴跌至42.7% | 昇腾950PR性能为H20的2.87倍 | 华为2026年计划出货约75万颗950PR芯片。 影响分析：这是中国AI算力基础设施从"进口依赖"转向"自主可控"的关键转折点。昇腾通过超节点架构的系统级创新弥补了单卡制程差距，但7nm及以下先进制程产能仍是长期瓶颈。 📅6月2日

📄 今日论文

1. Streaming Communication in Multi-Agent Reasoning

作者：Zhen Yang, Xiaogang Xu, Wen Wang et al. 核心贡献：提出StreamMA系统，打破传统多Agent推理中"生成-再传输"的串行范式，改为流式实时传输——每个推理步骤一生成即推送给下游Agent，实现Agent间流水线并行。实验发现，这种流水线不仅将端到端延迟从线性增长降为接近常数，还意外提升了推理质量，因为多步推理中早期步骤的可靠性显著高于后期步骤。 为什么重要：多Agent协作是2026年AI工程的核心趋势，StreamMA解决了深层Agent链的延迟爆炸问题，为构建可扩展的Agent网络提供了关键基础设施。 📄 arXiv:2606.05158 📅6月3日

2. Reinforcement Learning from Rich Feedback with Distributional DAgger

作者：Rishabh Agrawal, Jacob Fein-Ashley, Paria Rashidinejad 核心贡献：当前推理模型训练普遍依赖RLVR（仅从最终答案对错给单比特奖励），严重浪费了执行轨迹、工具输出、专家修正等丰富反馈信号。本文提出基于经典DAgger算法的分布化变体，系统性地将多元反馈整合进强化学习流程，在数学推理和代码生成任务上显著优于传统RLVR。 为什么重要：如果大模型训练能从"对错二元反馈"升级到"过程级丰富反馈"，将大幅提升复杂任务上的样本效率和最终性能，这是后RLHF时代的重要方向。 📄 arXiv:2606.05152 📅6月3日

3. AutoLab: Can Frontier Models Solve Long-Horizon Auto Research and Engineering Tasks?

作者：Zhangchen Xu, Junda Chen, Yue Huang et al. 核心贡献：现有基准大多评估单轮回答或短程Agent轨迹，无法衡量AI在真实科研中持续迭代改进的能力。AutoLab构建了一个超长期闭环自主研究基准，要求模型在数小时乃至数天的时间尺度上自主提出假设、运行实验、分析结果并持续优化方案，覆盖材料合成、电路设计、算法优化等真实工程任务。 为什么重要：AutoLab填补了"AI科学家"从概念到落地之间的评估空白。如果前沿模型能在该基准上取得进展，意味着AI将真正具备独立完成科研闭环的能力。 📄 arXiv:2606.05080 📅6月3日

💡 今日趋势

1. 记忆即护城河：OpenAI Dreaming V3的发布证明，AI竞争正从"单次对话质量"转向"跨对话长期记忆"。谁能构建最懂用户的持久上下文，谁就能锁定最高频的使用场景。

2. AI IPO超级周期：SpaceX以1.75万亿美元估值打破全球IPO纪录，Anthropic已秘密提交申请，OpenAI紧随其后。2026年下半年将是AI公司从私募走向公募的历史性窗口。

3. 中国模型反向输出美国：DeepSeek不仅开源模型免费传播，更以SaaS形态直接收取美国企业费用。成本优势正在转化为真实的跨境商业渗透，这是此前中国AI产品从未达到的深度。