一、巨头动向:从估值竞赛走向算力与产品的实弹赛
字节跳动披露 2026 年 AI 四大命题,对标 Google Genie 3
36 氪独家披露字节 2026 年 AI 关键命题:
- 世界模型年底对标 SOTA:将性能提升至对标 Google Genie 3 的全球第一梯队水平
- 视频模型继续领先:Seedance 系列继续探索”动态生成”新方向
- 多模态与智能体基础设施继续加码:把 Agent 能力做成各业务线的水电煤
- 组织与算力调度进一步向 AI 业务倾斜:内部资源全面 AI 化
这是字节第一次在内部定调中明确”对标 Genie 3”,也意味着世界模型正式成为国内大厂下一代旗舰竞争点。
火山引擎 MaaS 全年营收目标提至 150 亿,Seedance 2.0 单月破 10 亿
36 氪独家获悉,火山引擎 4 月已将 MaaS 业务营收目标上调至 150 亿元,且几乎每月都在调整——相比 2025 年底 100 亿的目标再上台阶。视频模型 Seedance 2.0 单月营收已突破 10 亿元,成为 AIGC 视频赛道最快变现产品。
一个 MaaS 业务,半年内目标上调 50%,且单独一款视频模型就能跑出月 10 亿——这是国内大模型商业化路径第一次给出”看得见的现金”样本。
二、模型与产品:智能体走向”工作台”
Claude Mythos 部署 15 国关键基础设施,Anthropic 正式递交 IPO
Anthropic 正式递交招股书冲刺上市,并同步把 Claude Mythos 推升至 15+ 国家的关键基础设施场景(电力、交通、通信等)。这是 Anthropic 在企业级市场的标志性事件——“AI 卖进最不能出错的系统”。
Claude Cowork 桌面 Agent:把 Claude Code 能力交给非开发者
Anthropic 推出 Claude Cowork——macOS 上的桌面 AI Agent,可直接读取、编辑、创建本地文件。配合 Claude Opus 4.8 主打”诚实性”(错误时主动标记不确定性),Anthropic 的产品策略已经从”卖给工程师”扩展到”卖给每一个用电脑的人”。
阿里 Qwen3.7-Plus 上线,多模态智能体新基座
阿里通义千问 Qwen3.7-Plus 正式发布,主打多模态智能体能力——可一键复刻桌面端专业软件(Photoshop、IDE、Office)的工作流。这是 Qwen 系列第一次明确把”多模态 + Agent”作为旗舰标签,意味着阿里云要把 Agent 从 Chatbot 升级为”操作系统的副驾”。
阶跃星辰 Step 3.7 Flash 开源,国产智能体模型的效率路线
Step 3.7 Flash(198B MoE)在 ClawEval 和 SimpleVQA Search 评测中排名第一,主打智能体工作流效率。配合阿里云百炼 CLI、字节 Bernini 框架开源——国产模型正在从”追赶通用能力”转向”在特定场景做到最优”。
微软 Build 2026:MAI-Thinking-1 + Scout 个人助手 + Project Solara
微软一口气放出自研推理模型 MAI-Thinking-1、基于 OpenClaw 理念的个人助手 Scout,以及专为 AI Agent 硬件设计的操作系统 Project Solara。微软的策略很清楚——自己不只做模型和应用,还要做”AI 硬件的操作系统”层。
三、具身智能与机器人:量产竞赛开打
CVPR 2026 现场:英伟达、特斯拉、Waymo 同台听中国公司讲物理 AI
CVPR 2026 物理 AI 专题挤满英伟达、特斯拉、Waymo 团队,演讲主角多为来自中国的具身智能与自动驾驶公司。中国厂商率先实现”数据采集 → 世界模型 → 闭环训练”飞轮,在物理 AI 赛道上抢占标准定义权。
特斯拉 Optimus 机器人工厂动工,规划年产能 1000 万台
特斯拉得州超级工厂内 Optimus 人形机器人专属工厂正式动工,规划年产能最高 1000 万台,计划 2027 年夏季大规模量产。同期:
- 理想汽车新增 3 个具身智能部门(具身工程、具身交互、具身行为)
- 宇树具身智能体验馆亚洲首店上海开业
- 星尘智能完成超 10 亿元 B 轮融资,估值破百亿
- 戴盟机器人完成亿元 A 轮(汇川产投 + 中国电信)
- 乘物机器人、智维创芯、浙大具身大脑团队密集融资
LeCun 10 亿美元押注的世界模型方向,国内视觉大模型团队早已布局
LeCun 最新创业项目 JEPA 2 押注隐空间世界模型。国内多家头部视觉大模型团队早在 2024 年起便布局此路径,CVPR 2026 多篇口头报告均来自中国团队。世界模型的话语权争夺,比通用 LLM 更早一步进入”中国 vs 美国”双极格局。
四、算力与硬件:硬件变成了工程问题
Meta 学特斯拉:用帐篷搭建 AI 数据中心
TechCrunch 报道,Meta 复制特斯拉早期搭帐篷快速上线产能的做法,将部分新建 AI 数据中心直接搭建在帐篷结构中,把算力上线时间从数年压缩到数月。
算力军备竞赛的下一步不是”造更好的芯片”,而是”更快把芯片用上”。
Nvidia 收购 Kumo AI,加码企业级生成式 AI 推理
Nvidia 正式收购专注企业数据上生成式 AI 推理与预测平台的 Kumo AI。Kumo 能力将整合进 Nvidia NIM 与 AI Enterprise 套件——Nvidia 在企业 GenAI 市场的全栈布局进一步强化。
Groq 融资 6.5 亿美元,AI 推理芯片成新热点
继 Nvidia 200 亿美元”非收购式招聘”后,AI 推理芯片公司 Groq 融资 6.5 亿美元。同期 XCENA 以 5.7 亿美元估值融资 1.35 亿美元,押注”内存是 AI 真正瓶颈”。
比亚迪发布中国首款 4nm 智驾芯片璇玑 A3
比亚迪发布中国首款 4nm 制程智驾芯片,已开启规模化量产,支持 L3/L4 自动驾驶,三颗芯片协同实现超 2100 TOPS 总算力。
OpenAI CFO:AI 硬件将于今年年底前正式发布
OpenAI CFO Sarah Friar 透露已亲身体验公司 AI 设备,确认将在”今年年底之前”正式发布——比此前内部文件预计的 2027 年 2 月量产节奏明显提前。
五、安全与治理:Anthropic 罕见呼吁暂停 AI 自我改进训练
据 WSJ 报道,Anthropic 在政策简报中呼吁全球范围内暂停能够显著提升 AI 自我改进能力的训练实验,认为现有对齐技术尚不足以应对”递归自我改进”带来的不可控风险。
这是主流大模型厂商首次以正式姿态提出训练暂停倡议,意义重大:
- 来自最不”保守”的玩家(Anthropic 商业化最激进)
- 时间点耐人寻味——正值 Anthropic 自身 IPO 递交
- 与上周 Anthropic 开源
defending-code-reference-harness形成”开源防御 + 呼吁暂停”组合拳
同期 Anthropic 还在 GitHub 开源了 AI 漏洞挖掘框架,可基于此微调出针对自家代码库的”安全审计 Agent”。
六、产品与生态:AI Agent 全面嵌入式落地
Apple 批准 Poke 成为首个 Messages for Business 上的 AI Agent
Apple 首次允许第三方 AI Agent 接入 Messages for Business 平台。这是 Apple 渠道对 AI Agent 生态正式开放的标志性事件。
Meta 将 WhatsApp Business AI Agent 推向全球
WhatsApp Business AI 客服 Agent 结束试点、面向全球商家开放,支持多语言自动应答、商品推荐与下单流程。
字节 Bernini 开源:给 DiT 配个”大模型军师”
字节开源统一框架 Bernini,主打”先理解再动手”的 AI 视频编辑能力——把大语言模型作为决策中枢,与扩散模型协同提升视频生成的可控性。
百度 PaddleOCR-VL-1.6 准确率 96.33%,刷新同尺寸 SOTA
百度文心团队发布 PaddleOCR-VL-1.6 文档解析模型,准确率 96.33%,巩固多模态文档理解优势。
豆包 6 月下旬正式付费,打通抖音电商
字节豆包大模型将于 6 月下旬正式开启付费订阅,并加速与抖音电商生态打通。同步推出”豆包汽车”方案,目标价位段锁定 10-20 万元主流家用车市场。
七、值得关注的数字
| 指标 | 数值 | 含义 |
|---|---|---|
| 火山引擎 MaaS 目标 | 150 亿元 | 比 2025 年底 100 亿上调 50% |
| Seedance 2.0 单月营收 | 10 亿元 | AIGC 视频最快变现记录 |
| Claude Mythos 部署国数 | 15+ | 关键基础设施级 AI 部署 |
| 特斯拉 Optimus 年产能规划 | 1000 万台 | 量产竞赛正式开打 |
| Meta 帐篷数据中心 | 上线时间压缩到数月 | 算力建设模式剧变 |
| 比亚迪璇玑 A3 | 3 颗 2100 TOPS | 国产车规级芯片新标杆 |
| Anthropic 估值(上周) | 9650 亿美元 | 行业进入万亿俱乐部 |
整体分析
本周 AI 行业最显著的信号是:商业规模化与产业嵌入同时加速,监管和治理从”讨论”走向”行动”。
从商业端看,字节火山引擎 MaaS 目标上调到 150 亿、Seedance 单月 10 亿、Anthropic 正式递交 IPO、Claude Mythos 部署 15 国关键基础设施——AI 行业第一阶段”技术验证”已经结束,进入”现金与场景”双重验证。火山引擎单月 Seedance 10 亿尤其重要:它第一次证明 AIGC 视频不是”烧钱”业务,而是能跑出真实现金流的生意。
从硬件端看,行业重心从”造更好的芯片”转向”更快把芯片用上”。Meta 搭帐篷、Anthropic 部署 15 国、Nvidia 收购 Kumo、OpenAI 硬件提前量产——AI 进入了”工程交付”阶段,供应链速度本身就是护城河。
从具身智能看,特斯拉 Optimus 年产能 1000 万台规划落地、CVPR 2026 物理 AI 议题被中国团队主导、LeCun 10 亿美元押注世界模型——机器人从 Demo 走向产线已无可争议。理想、宇树、戴盟、星尘、智维创芯等密集融资,国内 00 后创业者站上 C 位,反映出新一波”高赌注、高消耗、高估值”的玩法正在成型。
从治理端看,Anthropic 罕见呼吁暂停 AI 自我改进训练——这件事放在以前不可想象。这既是 Anthropic 自身的合规占位(IPO 前的风险管理),也是行业从”硬刚对齐”转向”主动设限”的转折点。Anthropic 的开源漏洞框架 + 暂停呼吁组合拳,说明头部厂商开始主动塑造监管叙事。
从产品端看,AI 全面”嵌入式”成为主旋律——Apple 批准 Poke 进 Messages for Business、Meta WhatsApp Business Agent 全球开放、阿里 Qwen3.7-Plus 复制桌面软件工作流、微软 Project Solara 为 AI Agent 硬件造系统——用户不再需要”去找 AI”,AI 直接出现在既有工作流里。
一句话总结:2026 年 6 月,AI 行业完成从”百模大战”到”场景之战”的切换,中国 AI 在具身智能和视频生成上首次拿到了全球标准定义权。
下周展望
- WWDC 2026 主题演讲:Siri 深度改版 + Apple Intelligence 全系统级升级 + 端侧模型 API
- Claude Mythos 进一步在企业关键基础设施场景铺开,关注 Anthropic 上市路演
- 特斯拉 Optimus 工厂 后续建设节奏,2027 夏季大规模量产前的供应链
- 字节豆包付费化 6 月下旬正式启动,关注商业化数据
- Nvidia × Kumo AI 整合落地节奏,AI Enterprise 套件新动作
- 可灵 AI 4K 短片 在 AI on the Lot 展示,AI 影视进入新阶段
- DeepSeek IPO 进展 和 Anthropic 融资后的产品动作
评论