AI Semanario | Las cuatro grandes propuestas de ByteDance AI, MaaS objetivo 15.000 millones, Claude Mythos despliega infraestructura en 15 países

title: "AI Semanario | Las cuatro grandes propuestas de ByteDance AI, MaaS objetivo 15.000 millones, Claude Mythos despliega infraestructura en 15 países"

description: "Esta semana en IA: ByteDance revela las cuatro propuestas principales de IA para 2026, Volcano Engine eleva su objetivo de MaaS a 150 mil millones, Claude Mythos despliega infraestructura crítica en 15 países, Meta construye centros de datos tipo tienda de campaña, Nvidia adquiere Kumo AI, Anthropic pide una pausa en el entrenamiento de mejora propia de IA"

pubDate: 2026-06-05

category: '周刊'

tags: ['AI周刊', '字节跳动', 'Anthropic', '火山引擎', 'Claude', '具身智能', '融资']

featured: true

readTime: "13分钟"

I. Movimientos de gigantes: de la competencia por valoración a la carrera real de potencia computacional y productos

ByteDance revela las cuatro propuestas clave de IA para 2026, siguiendo el nivel de Google Genie 3

36Kr revela en exclusiva las propuestas clave de IA de ByteDance para 2026:

Modelo de mundo a finales de año al nivel SOTA: mejorar el rendimiento hasta igualar el primer nivel mundial de Google Genie 3
Continuar liderando en modelos de video: la serie Seedance seguirá explorando la nueva dirección de "generación dinámica"
seguir invirtiendo en infraestructura multimodal y de agentes: convertir las capacidades de Agent en el suministro básico de cada línea de negocio
La organización y la asignación de potencia computacional seguirán inclinándose hacia el negocio de IA: internalizar todos los recursos hacia la IA

Esta es la primera vez que ByteDance establece claramente "seguir el nivel de Genie 3" en su posicionamiento interno, lo que también significa que el modelo de mundo se ha convertido oficialmente en el próximo punto de competencia insignia para los grandes fabricantes nacionales.

La plataforma Volcano Engine eleva el objetivo de ingresos anuales de MaaS a 150 mil millones, Seedance 2.0 supera los 10 mil millones en un mes

Según fuentes exclusivas de 36Kr, Volcano Engine ya subió en abril el objetivo de ingresos del negocio MaaS a 150 mil millones de yuanes, y prácticamente lo ajusta cada mes, superando aún más el objetivo de 100 mil millones de finales de 2025. El modelo de video Seedance 2.0 ya ha superado los 10 mil millones de yuanes en ingresos mensuales, convirtiéndose en el producto de monetización más rápido en el赛道 de video AIGC.

> Un solo negocio MaaS, con el objetivo ajustado un 50% en medio año, y un solo modelo de video que puede generar 10 mil millones al mes — esta es la primera vez que el camino de comercialización de grandes modelos nacionales proporciona una "muestra de dinero tangible".

II. Modelos y productos: los agentes se dirigen hacia la "estación de trabajo"

Claude Mythos despliega infraestructura crítica en 15 países, Anthropic presenta oficialmente su IPO

Anthropic presentó formalmente su solicitud de oferta pública inicial para acelerar su salida a bolsa, y simultáneamente impulsó Claude Mythos a escenarios de infraestructura crítica en más de 15 países (energía eléctrica, transporte, comunicaciones, etc.). Este es un evento emblemático para Anthropic en el mercado empresarial: "vender IA en los sistemas donde menos se pueden permitir errores".

Claude Cowork Desktop Agent: llevando las capacidades de Claude Code a no desarrolladores

Anthropic lanza Claude Cowork—un AI Agent de escritorio en macOS que puede leer, editar y crear archivos locales directamente. Combinado con Claude Opus 4.8, que prioriza la "honestidad" (marcando proactivamente la incertidumbre cuando hay errores), la estrategia de productos de Anthropic se ha expandido de "vender a ingenieros" a "vender a cada persona que usa una computadora".

Lanzamiento de Alibaba Qwen3.7-Plus: nueva base para agentes multimodales inteligentes

Alibaba lanza oficialmente Qwen3.7-Plus de Tongyi Qianwen, con capacidades multimodales de agentes inteligentes como característica principal—pudiendo replicar flujos de trabajo de software profesional de escritorio (Photoshop, IDE, Office) con un solo clic. Esta es la primera vez que la serie Qwen establece claramente "multimodal + Agente" como su etiqueta insignia, lo que significa que Alibaba Cloud busca actualizar los Agentes de simples Chatbots a "copilotos del sistema operativo".

Código abierto de Step 3.7 Flash de StepFun: la ruta de eficiencia para modelos de agentes nacionales

Step 3.7 Flash (198B MoE) ocupa el primer lugar en evaluaciones de ClawEval y SimpleVQA Search, priorizando la eficiencia en flujos de trabajo de agentes. Junto con el CLI Bailian de Alibaba Cloud y el framework Bernini de ByteDance de código abierto—los modelos nacionales están transitando de "perseguir capacidades generales" a "ser óptimos en escenarios específicos".

Microsoft Build 2026：MAI-Thinking-1 + Scout Asistente Personal + Project Solara

Microsoft lanzó de golpe su modelo de razonamiento propietario MAI-Thinking-1, el asistente personal Scout basado en el concepto de OpenClaw, y Project Solara, un sistema operativo diseñado específicamente para hardware de AI Agent. La estrategia de Microsoft es clara: no solo hacer modelos y aplicaciones, sino también construir la capa de "sistema operativo para hardware de AI".

III. Inteligencia Embebida y Robótica: Comienza la Carrera de Producción en Masa

CVPR 2026 en Vivo: NVIDIA, Tesla, Waymo Juntos Escuchando a Empresas Chinas Hablar de IA Física

El tópico de IA Física en CVPR 2026 estaba lleno de equipos de NVIDIA, Tesla y Waymo. Los protagonistas de las presentaciones fueron principalmente empresas chinas de inteligencia embebida y conducción autónoma. Los fabricantes chinos lograron primero implementar el ciclo virtuoso de "recolección de datos → modelo mundial → entrenamiento de circuito cerrado", ocupando el derecho de definición de estándares en la pista de IA Física.

Fábrica de Robots Tesla Optimus Comienza Construcción, Planificación de Capacidad Anual de 10 Millones de Unidades

Dentro de la Gigafactoría de Texas de Tesla, la fábrica exclusiva de robots humanoides Optimus ha comenzado oficialmente su construcción, con una planificación de capacidad anual de hasta 10 millones de unidades, prevista para producción en masa a gran escala en el verano de 2027. Simultáneamente:

Li Auto agregó 3 nuevos departamentos de inteligencia embebida (ingeniería embebida, interacción embebida, comportamiento embebido)
La primera tienda de experiencia de inteligencia embebida de Unitree en Asia abrió en Shanghái
Astribot Intelligence completó una ronda B de más de 1 mil millones de yuanes, con una valoración superior a los 10 mil millones
Dimon Robotics completó una ronda A de 100 millones de yuanes (inversión de Innovance y China Telecom)
Múltiples rondas de financiamiento cerradas consecutivamente por parte de equipos como Chengwu Robot, Zhiwei Chuangxin y el equipo de cerebro embebido de la Universidad de Zhejiang

La Dirección de Modelo Mundial que LeCun Apostó 1 Mil Millón de Dólares, Equipos Nacionales de Modelos de Visión a Gran Escala Ya Han Establecido

El último proyecto empresarial de LeCun, JEPA 2, apuesta por el modelo de mundo de espacio latente. Varios equipos chinos líderes en modelos de visión de gran escala comenzaron a desarrollar este camino desde 2024, y múltiples presentaciones orales en CVPR 2026 provienen de equipos chinos. La lucha por el poder discursivo de los modelos de mundo ha entrado en una estructura bipolar "China vs Estados Unidos" antes que los LLMs generales.

四, Computación y Hardware: El hardware se convierte en un problema de ingeniería

Meta aprende de Tesla: Construir centros de datos de IA con tiendas de campaña

TechCrunch informa que Meta está replicando el enfoque temprano de Tesla de construir tiendas de campaña para implementar capacidad rápidamente, construyendo algunos nuevos centros de datos de IA directamente en estructuras de tiendas de campaña, reduciendo el tiempo de puesta en marcha de la potencia computacional de varios años a varios meses.

> El siguiente paso en la carrera armamentística de computación no es "fabricar mejores chips", sino "usar los chips más rápido".

Nvidia adquiere Kumo AI, refuerza la inferencia de IA generativa empresarial

Nvidia adquiere oficialmente Kumo AI, una plataforma especializada en inferencia y predicción de IA generativa en datos empresariales. Las capacidades de Kumo se integrarán en el conjunto Nvidia NIM y AI Enterprise, lo que fortalecerá aún más la estrategia de pila completa de Nvidia en el mercado de GenAI empresarial.

Groq recauda 650 millones de dólares, los chips de inferencia de IA se convierten en un nuevo punto caliente

Tras la "contratación sin adquisición" de 20 mil millones de dólares de Nvidia, la empresa de chips de inferencia de IA Groq recauda 650 millones de dólares. Durante el mismo período, XCENA recauda 135 millones de dólares con una valoración de 570 millones de dólares, apostando por que "la memoria es el verdadero cuello de botella de la IA".

BYD lanza el primer chip de conducción inteligente de 4nm de China, Xuanji A3

BYD lanza el primer chip de conducción inteligente de 4nm de China, con producción en masa ya iniciada, soporta conducción autónoma L3/L4, tres chips trabajando en conjunto para lograr más de 2100 TOPS de potencia computacional total.

OpenAI CFO: El hardware de IA se lanzará oficialmente antes de finales de este año

La CFO de OpenAI, Sarah Friar, reveló que ya ha experimentado de primera mano el dispositivo de IA de la empresa, confirmando que se lanzará oficialmente "antes de finales de este año", lo cual representa un avance significativo respecto al calendario de producción en masa previsto para febrero de 2027 según documentos internos anteriores.

Cinco. Seguridad y gobernanza: Anthropic pide罕见过呼吁暂停 AI 自我改进训练

Según el WSJ, Anthropic pidió en un informe de políticas que se pause a nivel mundial los experimentos de entrenamiento que puedan mejorar significativamente las capacidades de auto-mejora de la IA, argumentando que las tecnologías de alineación actuales aún no son suficientes para hacer frente a los riesgos incontrolables que plantea la "auto-mejora recursiva".

Esta es la primera vez que un fabricante importante de modelos de lenguaje importantes adopta una postura formal para proponer una pausa en el entrenamiento, lo que tiene gran importancia:

Viene del jugador menos "conservador" (Anthropic es el más agresivo en comercialización)
El momento es interesante:正好正值 Anthropic 自身 IPO 递交
Se forma un组合拳 de "defensa de código abierto + petición de pausa" junto con la apertura上周 Anthropic 开源 defensing-code-reference-harness

同期 Anthropic 还在 GitHub 开源了 AI 漏洞挖掘框架，可基于此微调出针对自家代码库的"安全审计 Agent"。

Seis. Productos y ecosistema: Implementación integral de agentes de IA integrados

Apple approves Poke as the first AI Agent on Messages for Business

Apple впервые允许第三方 AI Agent 接入 Messages for Business 平台。这是 Apple 渠道对 AI Agent 生态正式开放的标志性事件。

Meta lleva el agente de IA de WhatsApp Business al mundo

WhatsApp Business AI 客服 Agent 结束试点、面向全球商家开放，支持多语言自动应答、商品推荐与下单流程。

ByteDance open source Bernini: un "asesor de modelos grandes" para DiT

ByteDance open source el marco unificado Bernini, con capacidades de edición de video con IA que priorizan "primero entender, luego actuar", utilizando modelos de lenguaje grandes como centro de decisiones, trabajando en conjunto con modelos de difusión para mejorar el control en la generación de video.

PaddleOCR-VL-1.6 de Baidu logra precisión del 96.33%, superando el SOTA en su categoría de tamaño

El equipo de Wenxin de Baidu lanza el modelo de análisis de documentos PaddleOCR-VL-1.6, con una precisión del 96.33%, consolidando su ventaja en comprensión multimodal de documentos.

Doubao comenzará a cobrar a finales de junio, conectándose con el ecosistema de comercio electrónico de Douyin

El modelo grande Doubao de ByteDance comenzará oficialmente las suscripciones de pago a finales de junio, y acelerará la integración con el ecosistema de comercio electrónico de Douyin. Simultáneamente, se lanza el plan "Doubao Auto", con el segmento de precio objetivo bloqueado en el mercado de automóviles familiares principales de 100,000-200,000 yuanes.

VII. Números a tener en cuenta

Indicador	Valor	Significado
Objetivo MaaS de Volcano Engine	150 mil millones	Aumento del 50% respecto a los 100 mil millones de finales de 2025
Ingresos mensuales de Seedance 2.0	10 mil millones	Récord de monetización más rápida de video AIGC
Países con implementación de Claude Mythos	15+	Implementación de IA a nivel de infraestructura crítica
Capacidad de producción anual planificada de Tesla Optimus	10 millones de unidades	La competencia de producción en masa comienza oficialmente
Meta Tienda de Datos	Tiempo de lanzamiento reducido a meses	Cambio dramático en el modelo de construcción de potencia computacional
BYD Xuanji A3	3 chips de 2100 TOPS	Nuevo estándar para chips automotrices nacionales
Valoración de Anthropic (semana pasada)	965 mil millones de dólares	La industria entra al club del billón

Análisis General

La señal más notable de la industria de IA esta semana es: La escala comercial y la integración industrial se aceleran simultáneamente, la regulación y gobernanza pasan de "discusión" a "acción".

Desde el punto de vista comercial, el objetivo de MaaS de ByteDance Volcano Engine se上调a 15 mil millones, Seedance alcanza 1 mil millones mensuales, Anthropic presenta formalmente su IPO, Claude Mythos se despliega en infraestructura crítica de 15 países—la primera fase de "verificación tecnológica" de la industria de IA ha terminado, entrando en la doble verificación de "efectivo y escenarios". El hecho de que Volcano Engine genere 1 mil millones mensuales con Seedance es especialmente importante: Por primera vez se demuestra que el video AIGC no es un negocio de "quemar dinero", sino uno que puede generar flujos de caja reales. Desde el punto de vista del hardware, el enfoque de la industria cambia de "fabricar mejores chips" a "implementar chips más rápido". Meta instala tiendas de datos, Anthropic despliega en 15 países, Nvidia adquiere Kumo, OpenAI inicia la producción anticipada de hardware—La IA ha entrado en la fase de "entrega de ingeniería", donde la velocidad de la cadena de suministro es en sí misma una barrera competitiva. Desde la inteligencia embodied, los planes de Tesla Optimus para una capacidad de producción anual de 10 millones de unidades se materializan, los temas de IA física en CVPR 2026 son liderados por equipos chinos, LeCun apuesta 1 mil millones de dólares por modelos del mundo—El paso de los robots del Demo a la línea de producción es innegable. Ideal, Yushu, Daimeng, Xingchen, Zhiwei Chuangxin y otros han logrado rondas de financiamiento intensivas, con emprendedores chinos de la generación 2000 ocupando posiciones de liderazgo, lo que refleja que un nuevo ciclo de玩法 de "alto riesgo, alto consumo, alta valoración" está tomando forma. Desde la perspectiva de gobernanza, Anthropic ha hecho un inusual llamado para pausar el entrenamiento de auto-mejora de IA, algo impensable anteriormente. Esto representa tanto el posicionamiento de cumplimiento de Anthropic (gestión de riesgos previa a la IPO) como un punto de inflexión para la industria que pasa de "enfrentar directamente el alineamiento" a "establecer límites proactivamente". La combinación del marco de vulnerabilidades de código abierto de Anthropic con el llamado a pausar demuestra que los principales fabricantes están comenzando a moldear activamente la narrativa regulatoria. Desde la perspectiva de productos, la IA completamente "embebida" se ha convertido en el tema principal: Apple aprueba Poke para Messages for Business, Meta WhatsApp Business Agent se abre globalmente, Alibaba Qwen3.7-Plus replica flujos de trabajo de software de escritorio, Microsoft Project Solara crea un sistema para hardware de IA Agent. Los usuarios ya no necesitan "buscar la IA", la IA aparece directamente en los flujos de trabajo existentes. Resumen en una frase: En junio de 2026, la industria de IA completó la transición de la "guerra de los cien modelos" a la "guerra de escenarios", con la IA china obteniendo por primera vez el poder de definir estándares globales en inteligencia encarnada y generación de video.

Perspectivas para la próxima semana

Keynote de WWDC 2026: Rediseño profundo de Siri + Actualización a nivel de sistema de Apple Intelligence + API de modelos en el dispositivo
Claude Mythos se expandirá aún más en escenarios de infraestructura crítica empresarial, prestando atención al roadshow de salida a bolsa de Anthropic
Fábrica de Tesla Optimus: Ritmo de construcción posterior, cadena de suministro antes de la producción en masa a gran escala en verano de 2027
La monetización de Doubao de ByteDance comenzará oficialmente a finales de junio, prestando atención a los datos de comercialización

Nvidia × Kumo AI Integración de implementación, nuevas acciones de la suite AI Enterprise
可灵 AI 4K 短片 Presentados en AI on the Lot, el cine y televisión AI entra en una nueva etapa
DeepSeek IPO Avances y movimientos de productos de Anthropic tras la financiación