title: "AI Wochenbericht | ByteDance AI: Vier große Thesen, MaaS-Ziel 150 Milliarden, Claude Mythos: Infrastruktur in 15 Ländern"
description: "Diese Woche KI-Highlights: ByteDance hat vier große KI-Thesen für 2026 enthüllt, Volcano Engine hat sein MaaS-Ziel auf 150 Milliarden erhöht, Claude Mythos hat Schlüsselinfrastruktur in 15 Ländern bereitgestellt, Meta errichtet ein Zelt-Rechenzentrum, Nvidia übernimmt Kumo AI, Anthropic fordert einen Stopp des KI-Selbstverbesserungstrainings."
pubDate: 2026-06-05
category: '周刊'
tags: ['AI周刊', '字节跳动', 'Anthropic', '火山引擎', 'Claude', '具身智能', '融资']
featured: true
readTime: "13分钟"
views: 1
I. Bewegungen der Giganten: Vom Bewertungswettbewerb zum harten Wettkampf bei Rechenleistung und Produkten
ByteDance enthüllt vier Kernthesen für KI 2026, orientiert sich an Google Genie 3
36Kr exklusiv enthüllt ByteDances KI-Kernthesen für 2026:
- Weltmodell bis Jahresende auf SOTA-Niveau: Die Leistung auf das Niveau der Weltspitze entsprechend Google Genie 3 steigern
- Videomodelle weiterhin führend: Die Seedance-Serie erkundet weiterhin neue Richtungen bei der „dynamischen Generierung"
- Multimodale und Agent-Infrastruktur weiter ausbauen: Agent-Fähigkeiten als grundlegende Ressource für alle Geschäftsbereiche etablieren
- Organisation und Rechenressourcen-Allokation weiterhin zugunsten des KI-Geschäfts verschieben: Interne Ressourcen vollständig KI-orientiert
Dies ist das erste Mal, dass ByteDance intern explizit „Orientierung an Genie 3" betont, und bedeutet auch, dass das Weltmodell offiziell zum nächsten Flaggschiff-Wettbewerbspunkt der inländischen Tech-Giganten wird.
Volcano Engine hebt MaaS-Jahresumsatzziel auf 15 Milliarden an, Seedance 2.0 durchbricht im Monat 1 Milliarde
36Kr exklusiv bekannt: Volcano Engine hat im April das MaaS-Umsatzziel auf 15 Milliarden Yuan angehoben, mit nahezu monatlichen Anpassungen – ein weiterer Schritt gegenüber dem Ziel von 10 Milliarden Ende 2025. Das Videomodell Seedance 2.0 hat die monatliche Umsatzschwelle von 1 Milliarde Yuan durchbrochen und ist damit das am schnellsten monetarisierende Produkt im AIGC-Videosegment.
> Ein einzelnes MaaS-Geschäft, das Ziel innerhalb von sechs Monaten um 50% angehoben, und ein einzelnes Videomodell erzielt monatlich 1 Milliarde – dies ist das erste Mal, dass der kommerzielle Weg großer inländischer Modelle ein „sichtbares Geld"-Beispiel liefert.
II. Modelle und Produkte: Agenten wandern zur „Werkbank"
Claude Mythos in 15 Ländern für kritische Infrastruktur eingesetzt, Anthropic reicht offiziell IPO ein
Anthropic reicht offiziell den Börsenprospekt ein, um an die Börse zu gehen, und bringt gleichzeitig Claude Mythos in Schlüsselinfrastrukturszenarien in über 15 Ländern voran (Strom, Verkehr, Kommunikation usw.). Dies ist ein Meilenstein für Anthropic auf dem Enterprise-Markt – „KI in die Systeme verkaufen, in denen keine Fehler passieren dürfen".
Claude Cowork Desktop-Agent: Die Claude Code-Fähigkeiten für Nicht-Entwickler verfügbar machen
Anthropic stellt Claude Cowork vor – einen Desktop-KI-Agenten für macOS, der lokale Dateien direkt lesen, bearbeiten und erstellen kann. In Kombination mit Claude Opus 4.8, das auf „Ehrlichkeit" setzt (aktive Kennzeichnung von Unsicherheiten bei Fehlern), hat Anthropics Produktstrategie sich bereits von „an Ingenieure verkaufen" zu „an jeden, der einen Computer benutzt" erweitert.
Alibaba Qwen3.7-Plus startet, neue Basis für multimodale Agenten
Alibabas Tongyi Qianwen Qwen3.7-Plus ist offiziell erschienen, mit dem Schwerpunkt multimodale Agentenfähigkeiten – Ein-Klick-Nachbildung von Workflows professioneller Desktop-Software (Photoshop, IDE, Office). Dies ist das erste Mal, dass die Qwen-Serie explizit „Multimodal + Agent" als Flaggschiff-Label verwendet, was bedeutet, dass Alibaba Cloud den Agenten von einem Chatbot zu einem „Copiloten des Betriebssystems" aufrüsten möchte.
Step 3.7 Flash von StepFun opensource, Effizienzroute für inländische Agentenmodelle
Step 3.7 Flash (198B MoE) belegt den ersten Platz in den Benchmarks ClawEval und SimpleVQA Search und konzentriert sich auf die Effizienz von Agent-Workflows. In Kombination mit Alibaba Cloud Bailian CLI und ByteDances Bernini-Framework als Open Source – inländische Modelle entwickeln sich von „Aufholen bei allgemeinen Fähigkeiten" hin zu „in bestimmten Szenarien das Optimum erreichen".
Microsoft Build 2026: MAI-Thinking-1 + Scout persönlicher Assistent + Project Solara
Microsoft hat auf einen Schlag sein eigenes Reasoning-Modell MAI-Thinking-1, den persönlichen Assistenten Scout basierend auf dem OpenClaw-Konzept und das Betriebssystem Project Solara speziell für AI-Agent-Hardware vorgestellt. Microsofts Strategie ist klar – das Unternehmen will nicht nur Modelle und Anwendungen entwickeln, sondern auch die „Betriebssystem-Schicht für AI-Hardware" bereitstellen.
III. Embodiment Intelligence und Robotik: Der Massenproduktionswettbewerb beginnt
CVPR 2026 vor Ort: NVIDIA, Tesla und Waymo hören gemeinsam chinesischen Unternehmen bei Physical AI zu
Die Physical AI-Track-Sessions auf der CVPR 2026 waren voll besetzt mit Teams von NVIDIA, Tesla und Waymo, wobei die Hauptredner größtenteils aus chinesischen Unternehmen für Embodiment Intelligence und autonomes Fahren stammten. Chinesische Hersteller haben als erste den „Datenerfassung → Weltmodell → Closed-Loop-Training"-Flywheel realisiert und besetzen damit die Definitionshoheit für Standards im Physical AI-Wettbewerb.
Teslas Optimus Roboterfabrik im Bau, geplante Jahresproduktion von 10 Millionen Einheiten
In Teslas Gigafactory in Texas wurde offiziell mit dem Bau einer dedizierten Fabrik für Optimus humanoide Roboter begonnen, mit einer geplanten Jahresproduktion von bis zu 10 Millionen Einheiten und einem Zeitplan für die Massenproduktion im Sommer 2027. Parallel dazu:
- Li Auto hat 3 neue Embodied-Intelligence-Abteilungen hinzugefügt (Embodied Engineering, Embodied Interaction, Embodied Behavior)
- Unitree Embodied Intelligence Experience Store eröffnet erste Asien-Niederlassung in Shanghai
- Stardust Intelligence schließt über 1 Milliarde RMB Series-B-Finanzierungsrunde ab, Bewertung übersteigt 10 Milliarden
- Dimon Robotics schließt 100-Millionen-RMB Series-A-Runde ab (geführt von Inovance Industrial Investment + China Telecom)
- Chengwu Robot, Zhiwei Chuangxin und Zhejiang University Embodied Brain Team sichern sich dicht gedrängt Finanzierungen
Die von LeCun mit 1 Milliarde Dollar gesetzte Richtung für Weltmodelle, in der heimische Vision-Modellteams bereits investiert haben
LeCun的最新创业项目JEPA 2押注latente Raum-Weltmodelle。国内多家头部视觉大模型团队早在2024年起便布局此路径,CVPR 2026多篇口头报告均来自中国团队。Der Kampf um die Deutungshoheit bei Weltmodellen tritt früher als bei generischen LLMs in eine bipolare „China vs. USA"-Struktur ein。
四、算力与硬件:硬件变成了工程问题
Meta 学特斯拉:用帐篷搭建 AI 数据中心
TechCrunch berichtet, dass Meta die frühe Praxis von Tesla, Zelte zur schnellen Inbetriebnahme der Produktionskapazität zu nutzen, kopiert hat und einige neu gebaute AI-Rechenzentren direkt in Zeltstrukturen errichtet, wodurch die Zeit bis zur Bereitstellung der Rechenleistung von mehreren Jahren auf wenige Monate verkürzt wird。
> Der nächste Schritt im Wettrüsten um Rechenleistung ist nicht „bessere Chips herstellen", sondern „die Chips schneller einsetzen".
Nvidia 收购 Kumo AI,加码企业级生成式 AI 推理
Nvidia hat offiziell Kumo AI übernommen, eine Plattform für generative KI-Inferenz und Vorhersage auf Unternehmensebene. Die Fähigkeiten von Kumo werden in Nvidias NIM- und AI-Enterprise-Suiten integriert – Nvidias Full-Stack-Aufstellung im Enterprise-GenAI-Markt wird weiter gestärkt.
Groq 融资 6.5 亿美元,AI 推理芯片成新热点
Nach Nvidias 20-Milliarden-Dollar-'Nicht-Übernahme-Recruiting' hat das KI-Inferenzchip-Unternehmen Groq 650 Millionen Dollar eingesammelt. Im selben Zeitraum hat XCENA 135 Millionen Dollar bei einer Bewertung von 570 Millionen Dollar aufgenommen und setzt darauf, dass 'Speicher der wahre Engpass für KI ist'.
比亚迪发布中国首款 4nm 智驾芯片璇玑 A3
BYD hat den ersten in China hergestellten 4‑nm‑Autofahrchip, den Xuanji A3, vorgestellt, der bereits in Serienproduktion gegangen ist, L3/L4‑Automatisiertes Fahren unterstützt und mit drei Chips zusammen über 2100 TOPS Gesamtrechenleistung erreicht.
OpenAI CFO: AI-Hardware wird vor Ende des Jahres offiziell veröffentlicht
OpenAI CFO Sarah Friar hat bekannt gegeben, dass sie das KI-Gerät des Unternehmens bereits persönlich getestet hat, und bestätigt, dass es „vor Ende dieses Jahres" offiziell auf den Markt kommen wird – deutlich früher als der zuvor in internen Dokumenten erwartete Produktionszeitplan von Februar 2027.
Fünf, Sicherheit und Governance: Anthropic fordert seltenen Stopp der KI-Selbstverbesserungstraining
Wie das Wall Street Journal berichtet, hat Anthropic in einem Policy-Briefing weltweit zum Stopp von Trainings experimenten aufgerufen, die die KI-Selbstverbesserungsfähigkeiten erheblich steigern könnten, und argumentiert, dass die bestehenden Alignment-Techniken nicht ausreichen, um die unkontrollierbaren Risiken der „rekursiven Selbstverbesserung" zu bewältigen.
Dies ist das erste Mal, dass ein großer KI-Modellanbieter in offizieller Form einen Trainingsstopp vorschlägt, was von großer Bedeutung ist:- Von dem am wenigsten „konservativen" Akteur (Anthropic ist bei der Kommerzialisierung am aggressivsten)
- Der Zeitpunkt ist bemerkenswert – gerade als Anthropic seinen eigenen Börsengang einreichte
- In Verbindung mit der letzten Woche von Anthropic erfolgten Open-Source-Veröffentlichung von
defending-code-reference-harnessals „Open-Source-Verteidigung + Aufruf zum Stopp"-Kombination
Gleichzeitig hat Anthropic auch ein KI-Schwachstellen-Such-Framework auf GitHub als Open Source veröffentlicht, das zur Feinabstimmung eines „Sicherheits-Audit-Agenten" für die eigenen Codebasen verwendet werden kann.
Sechs, Produkte und Ökosystem: AI Agent wird umfassend eingebettet
Apple genehmigt Poke als ersten AI Agent auf Messages for Business
Apple erlaubt erstmals einem Drittanbieter-AI-Agenten den Zugang zur Messages for Business-Plattform. Dies ist ein symbolisches Ereignis dafür, dass die Apple-Plattform für das AI-Agent-Ökosystem offiziell geöffnet wird.
Meta bringt den WhatsApp Business KI‑Agenten weltweit auf den Markt
Der WhatsApp Business KI‑Kundendienst‑Agent beendet die Pilotphase und steht nun weltweit für Unternehmen zur Verfügung. Er unterstützt mehrsprachige automatische Beantwortung, Produktempfehlungen und Bestellvorgänge.
ByteDance Bernini Open Source: dem DiT einen „großen Modell-Strategen" hinzufügen
ByteDance hat das einheitliche Framework Bernini als Open‑Source freigegeben, das auf die KI‑Videobearbeitung mit dem Prinzip „Erst verstehen, dann handeln" setzt – dabei fungiert das große Sprachmodell als Entscheidungszentrale und arbeitet zusammen mit Diffusionsmodellen, um die Kontrolle über die Videogenerierung zu verbessern.
Baidu PaddleOCR‑VL‑1.6 mit 96,33 % Genauigkeit – neuer SOTA
Baidu's ERNIE‑Team hat das Dokumentenparsing‑Modell PaddleOCR‑VL‑1.6 veröffentlicht, das eine Genauigkeit von 96,33 % erreicht und damit die Stärken des multimodalen Dokumentenverständnisses weiter ausbaut.
Doubao startet Ende Juni ein kostenpflichtiges Angebot und integriert sich in Douyin E‑Commerce
ByteDance wird das Doubao‑Großmodell Ende Juni ein kostenpflichtiges Abonnement einführen und die Integration in das Douyin‑E‑Commerce‑Ökosystem beschleunigen. Parallel dazu wird das Doubao Auto‑Konzept vorgestellt, das auf den Mainstream‑Markt für Familienautos im Preissegment von 100.000 bis 200.000 Yuan ausgerichtet ist.
7. Bemerkenswerte Zahlen
| Kennzahl | Wert | Bedeutung |
| Volcengine MaaS‑Ziel | 150 Milliarden Yuan | Eine Erhöhung um 50 % gegenüber den 100 Milliarden Yuan Ende 2025 |
| Seedance 2.0 monatlicher Umsatz | 10 Milliarden Yuan | Schnellste Monetarisierung eines AIGC‑Videos |
| Anzahl der Länder, in denen Claude Mythos eingesetzt wird | 15+ | KI‑Bereitstellung auf kritischer Infrastrukturebene |
| Tesla Optimus jährliche Produktionskapazität | 10 Millionen Einheiten | Der Massenproduktionswettbewerb hat offiziell begonnen |
| Meta Zelt-Rechenzentrum | Bereitstellungszeit auf wenige Monate verkürzt | Radikaler Wandel im Rechenleistungs-Aufbaumodell |
| 比亚迪璇玑 A3 | 3 × 2100 TOPS | Neuer Maßstab für inländische automotivtaugliche Chips |
| Anthropic Bewertung (letzte Woche) | 965 Milliarden US-Dollar | Branche tritt Club der Billionäre bei |
Gesamtananalyse
Das deutlichste Signal der KI-Branche in dieser Woche: Die kommerzielle Skalierung und die industriellen Verankerung beschleunigen sich gleichzeitig, Regulierung und Governance gehen von „Diskussion" zu „Handlung" über.
Aus Geschäftssicht wurden die Ziele der ByteDance Volcano Engine MaaS auf 15 Milliarden erhöht, Seedance erzielt monatlich 1 Milliarde, Anthropic hat offiziell den Börsengang eingereicht, Claude Mythos ist in 15 Ländern mit kritischen Infrastrukturen eingesetzt – die erste Phase der „technischen Verifizierung" der KI-Branche ist beendet und geht in die „doppelte Verifizierung" von Cashflow und Anwendungsszenarien über. Besonders wichtig ist, dass Seedance monatlich 1 Milliarde erreicht: Damit wird zum ersten Mal bewiesen, dass AIGC-Video kein „Geldverbrennungs"-Geschäft ist, sondern ein Geschäft, das echten Cashflow generieren kann. Aus Hardware-Sicht hat sich der Schwerpunkt der Branche von „bessere Chips herstellen" zu „Chips schneller einsetzen" verlagert. Meta baut Zelte, Anthropic deployt in 15 Ländern, Nvidia übernimmt Kumo, OpenAI-Hardware wird früher in Massenproduktion gefertigt – KI ist in die Phase der „Engineering-Lieferung" eingetreten, wobei die Geschwindigkeit der Lieferkette selbst zum Schutzwall wird. Aus Sicht der Embodied Intelligence wurde Teslas Optimus jährliche Produktionskapazität von 10 Millionen Einheiten realisiert, CVPR 2026 Physik-KI-Themen werden von chinesischen Teams dominiert, LeCun setzt 1 Milliarde auf Weltmodelle – dass Roboter von der Demo zur Produktionslinie übergehen, ist unbestreitbar. Dichte Finanzierungsrunden von Li Auto, Unitree, Daimeng, Xingchen, Zhiwei und anderen, sowie 00er-Jahre-Inlandsgründer, die in den Vordergrund treten, spiegeln wider, dass eine neue Runde von „hohen Einsätzen, hohem Verbrauch, hoher Bewertung" gerade entsteht. Aus Governance-Perspektive, fordert Anthropic selten einen Stopp des KI-Selbstverbesserungstrainings – das wäre früher unvorstellbar gewesen. Dies ist sowohl Anthropics eigene Compliance-Positionierung (Risikomanagement vor dem IPO) als auch ein Wendepunkt für die Branche, weg von der „harten Ausrichtung" hin zu „proaktiven Einschränkungen". Anthropics Open-Source-Schwachstellen-Framework in Kombination mit dem Stoppaufruf zeigt, dass führende Anbieter beginnen, aktiv die Regulierungsnarrative zu gestalten. Aus Produktperspektive, wird KI umfassend „eingebettet" zum Maintheme – Apple hat Poke für Messages for Business zugelassen, Meta WhatsApp Business Agent weltweit geöffnet, Alibaba Qwen3.7-Plus repliziert Desktop-Software-Workflows, Microsoft Project Solara entwickelt ein System für KI-Agent-Hardware – Benutzer müssen nicht mehr „nach KI suchen", KI erscheint direkt in bestehenden Workflows. Ein-Satz-Zusammenfassung: Im Juni 2026 vollzog die KI-Branche den Wandel vom „Hundert-Modelle-Kampf" zum „Szenario-Krieg", wobei chinesische KI zum ersten Mal die globale Standarddefinitionsmacht bei verörperlichter Intelligenz und Videogenerierung erlangte.Ausblick auf die nächste Woche
- WWDC 2026 Keynote: Tiefgreifende Überarbeitung von Siri + systemweites Upgrade von Apple Intelligence + Edge-Modell-API
- Claude Mythos expandiert weiter in unternehmenskritische Infrastrukturszenarien, achten Sie auf Anthropics Roadshow für den Börsengang
- Tesla Optimus Fabrik: Folgebau-Rhythmus, Lieferkette vor der geplanten Massenproduktion im Sommer 2027
- ByteDance Doubao Bezahlversion: Offizieller Start Ende Juni, achten Sie auf die Monetarisierungsdaten
- Nvidia × Kumo AI Integration und Bereitstellungszeitplan, neue Maßnahmen für die AI Enterprise Suite
- 可灵 AI 4K 短片 auf AI on the Lot vorgestellt, KI-Film erreicht eine neue Phase
- DeepSeek IPO 进展 und Produktmaßnahmen nach der Finanzierung von Anthropic
Kommentare