AI Tuần #22: Kỷ nguyên nghìn tỷ đô bắt đầu, lập trình agent trở thành chiến trường mới

I. Tài trợ và bối cảnh ngành: Câu lạc bộ nghìn tỷ đô mở rộng

Anthropic định giá $965B: "Khoảnh khắc Apple" của AI

Anthropic hoàn thành vòng Series H trị giá $65B do Altimeter Capital dẫn đầu, đạt định giá post-money $965B với doanh thu hàng năm vượt $47B. Mức định giá này tiệm cận top 10 công ty công nghệ toàn cầu theo vốn hóa thị trường. Tăng trưởng doanh thu chủ yếu từ triển khai doanh nghiệp — sử dụng trả phí của Claude trong các kịch bản agent lập trình tăng vọt, gói doanh nghiệp chuyển từ giảm giá cố định sang tính phí theo sử dụng.

DeepSeek chuẩn bị IPO tại STAR Market: Vốn hóa AI Trung Quốc tăng tốc

DeepSeek dự kiến nộp đơn IPO tại STAR Market ngay sau khi hoàn thành khoảng $50B tài trợ — công ty mô hình nền tảng AI Trung Quốc đầu tiên xác định rõ lộ trình IPO. Kết hợp với Alibaba Cloud được Omdia đánh giá là lãnh đạo thị trường AI agent và Qwen3.7-Max dẫn đầu bảng xếp hạng phổ biến OpenRouter, sự hiện diện toàn cầu của AI Trung Quốc tiếp tục tăng.

OpenRouter Series B $113M: Lớp tổng hợp mô hình được xác nhận

OpenRouter đảm bảo Series B do CapitalG dẫn đầu, xác nhận "định tuyến mô hình" như lớp middleware đã trở nên thiết yếu. Khi số lượng mô hình bùng nổ, nhà phát triển cần một cổng thống nhất để chuyển đổi, so sánh và giảm chi phí.

II. Ra mắt mô hình: Khả năng agent là điểm bán hàng cốt lõi

Claude Opus 4.8: Nâng cấp dần dần, lập trình là vua

Anthropic phát hành Claude Opus 4.8, định vị là bản nâng cấp từ 4.7 với cải thiện về lập trình, kỹ năng agent và suy luận cùng mức giá. Tính năng "Dynamic Workflows" ra mắt đồng thời cho phép Claude Code chạy hàng chục đến hàng trăm sub-agent song song trong một phiên duy nhất, xử lý tìm bug xuyên codebase và di chuyển quy mô lớn.

Grok Build 0.1: xAI chính thức tham gia đấu trường agent lập trình

Grok Build của xAI được huấn luyện chuyên biệt cho tác vụ lập trình agent, hỗ trợ phát triển web, gỡ lỗi và MCP với tốc độ suy luận vượt 100 tok/s. Đánh dấu xAI vượt ra ngoài mô hình chat, cạnh tranh trực tiếp với Cursor/Claude Code.

Step 3.7 Flash: Mô hình Trung Quốc đi theo hướng hiệu quả

Step 3.7 Flash (198B MoE) xếp hạng nhất trong đánh giá ClawEval và SimpleVQA Search, tập trung vào hiệu quả workflow agent. Mô hình Trung Quốc đang chuyển từ "đuổi kịp năng lực tổng quát" sang "tối ưu cho kịch bản cụ thể."

III. Sản phẩm và công cụ: Hệ sinh thái agent tăng tốc hình thành

Các sản phẩm ra mắt tuần này cho thấy xu hướng rõ ràng: AI đang chuyển từ "hộp chat" sang "bàn làm việc".

Replit Canvas: Công cụ thiết kế agent, chuyển công việc thiết kế từ chat sang canvas
Perplexity Computer: Tích hợp Microsoft Office, gọi AI trực tiếp trong Excel/Word/PPT
Data Formulator: Công cụ phân tích dữ liệu doanh nghiệp AI của Microsoft
Google Pay MCP Server: Kết nối trợ lý phát triển AI trực tiếp với API thanh toán
Alibaba Cloud Bailian CLI: Agent mã nguồn mở với đầy đủ khả năng mô hình và ứng dụng

MCP (Model Context Protocol) đang trở thành tiêu chuẩn thực tế để kết nối AI với công cụ bên ngoài.

IV. Biên giới nghiên cứu: Mô hình mới cho huấn luyện và đánh giá agent

Framework Polar của NVIDIA: Đột phá trong huấn luyện RL agent

NVIDIA mã nguồn mở Polar, framework học tăng cường cho agent không yêu cầu viết lại framework hiện có (Codex CLI, Claude Code, v.v.), kết nối với huấn luyện GRPO bằng cách đặt agent tại ranh giới API mô hình. Thí nghiệm cho thấy mô hình dựa trên Qwen cải thiện điểm benchmark Codex 594,74%.

Framework SIA: Tự cải thiện đệ quy của AI

Framework SIA (Self-Improving AI) mã nguồn mở của hexoai chứng minh agent AI không chỉ tối ưu workflow bên ngoài mà còn trực tiếp cập nhật trọng số mô hình của chính mình thông qua phản hồi tác vụ — thêm bằng chứng cho "AI huấn luyện AI."

KPop: Huấn luyện RL ổn định cho mô hình MoE quy mô lớn

Phương pháp KPop đưa Ring-2.6-1T vượt 76 điểm trên SWE-bench Verified, sử dụng masking thích ứng thay thế mask tỷ lệ cố định, giải quyết vấn đề ổn định trong huấn luyện RL mô hình MoE quy mô lớn.

V. Tín hiệu xu hướng

PMF agent lập trình được xác nhận: Cursor báo cáo sản lượng code hàng tuần của nhà phát triển tăng từ 3,6K lên 8,6K dòng, tỷ lệ giữ lại code AI tiếp tục cải thiện
Quản trị an toàn theo kịp: OpenAI phát hành "Frontier Governance Framework" phù hợp quy định EU và California, ITBench cho thấy mô hình tiên tiến vẫn dưới 50% trong tác vụ IT doanh nghiệp
Cuộc đua phần cứng nóng lên: Samsung mẫu HBM4E, NVIDIA đầu tư ~$150B/năm tại Đài Loan, Huawei ra chip Kirin mới
Kỹ thuật prompt khoa học hóa: FaceMind đề xuất Adam's Law (luật tần suất văn bản), cung cấp cơ sở lý thuyết định lượng cho tối ưu prompt

Số liệu đáng chú ý tuần này

Chỉ số	Giá trị	Ý nghĩa
Định giá Anthropic	$965B	Gần nghìn tỷ, công ty AI đầu tiên ở mức này
Doanh thu năm Anthropic	$47B	Thanh toán AI doanh nghiệp quy mô lớn
Định giá tài trợ DeepSeek	$50B	Trong số định giá unicorn AI Trung Quốc cao nhất
Doanh thu năm Cognition	$4,92B	Thương mại hóa lab agent được xác nhận
Cải thiện framework Polar	594,74%	Tiềm năng khổng lồ của huấn luyện RL agent
Sản lượng code tuần nhà phát triển	8,6K dòng	Năng suất gấp đôi với hỗ trợ AI

Phân tích tổng thể

Tín hiệu đáng chú ý nhất trong AI tuần này: quy mô vốn và cạnh tranh kỹ thuật đồng thời bước vào tầm mức mới.

Từ phía vốn, định giá $965B của Anthropic, đẩy IPO $50B của DeepSeek, Series B $113M của OpenRouter — thị trường không còn tranh luận "AI có giá trị không" mà cạnh tranh "ai trở thành nền tảng nghìn tỷ tiếp theo." Anthropic và OpenAI đồng thời chuyển từ "thu hút bằng trợ cấp" sang "tính phí theo sử dụng" cho thấy sử dụng agent lập trình đã đủ lớn để hỗ trợ doanh thu khổng lồ — PMF xác nhận.

Từ phía công nghệ, trọng tâm chuyển từ "mô hình lớn hơn, mạnh hơn" sang "agent đưa vào sản xuất thế nào." Dynamic Workflows của Claude Opus 4.8, cải thiện 594% của NVIDIA Polar, tự cải thiện đệ quy của SIA — những tiến bộ này chỉ cùng hướng: khả năng lập trình AI có thể tiến hóa liên tục qua huấn luyện RL tự động, không phụ thuộc gán nhãn thủ công. Chiến lược Anthropic đặc biệt rõ ràng: không theo đuổi ra mắt gây sốc, mà lặp lại tần suất cao, mỗi nâng cấp tập trung "làm sử dụng hàng ngày của nhà phát triển mượt mà hơn."

Từ phía sản phẩm, "AI nhúng" trở thành xu hướng chính — không bắt người dùng tìm AI, mà làm AI xuất hiện trong workflow hiện có. Với nhà phát triển, chi phí API sẽ ngày càng là yếu tố lựa chọn quan trọng, và nền tảng tổng hợp mô hình (như OpenRouter) được vốn xác nhận vì lý do này.

Một câu tóm tắt: Q2 2026, ngành AI chính thức chuyển từ "giai đoạn xác nhận công nghệ" sang "giai đoạn mở rộng thương mại," agent lập trình là ứng dụng sát thủ đầu tiên được xác nhận.

Triển vọng tuần tới

Ra mắt sản phẩm hậu Google I/O 2026 (Gemini Omni, Gemini 3.5 Flash)
Kling AI trình chiếu phim ngắn gốc 4K tại AI on the Lot, sản xuất phim AI bước vào giai đoạn mới
Theo dõi tiến trình IPO DeepSeek và động thái sản phẩm hậu tài trợ của Anthropic