Resumo de Hoje
No âmbito interno, a Zhipu lançou a API de alta velocidade GLM-5.1 e estabeleceu um novo recorde mundial de latência, a equipe Wenxin do Baidu lançou o modelo de análise de documentos PaddleOCR-VL-1.6, o Qwen3.7-Plus da Alibaba Tongyi superou o GPT-5.4 na avaliação de compreensão de tela, e a Tencent Huyuan abriu ao público simultaneamente o algoritmo de atenção esparsa Stem e o plugin de memória de longo prazo Hy-Memory; no âmbito internacional, a Anthropic abriu o código de uma estrutura de descoberta de vulnerabilidades de IA e revelou pesquisas sobre "autoaperfeiçoamento de IA", o Alphabet anunciou um financiamento de capital de 80 bilhões de dólares para expandir a capacidade computacional de IA, a Liquid AI lançou o novo modelo LFM2.5 MoE de 8B, e o setor continua a acelerar em três linhas principais: "capacidade do modelo + infraestrutura computacional + engenharia de Agent".
Destaques Nacionais
🔥 Zhipu Lança GLM-5.1 de Alta Velocidade, Estabelecendo Novo Recorde Mundial de Velocidade de API de Grandes Modelos
A Zhipu lançou em 4 de junho a API de alta velocidade GLM-5.1, com a latência do primeiro token medida sendo 60% menor que a geração anterior, estabelecendo um novo recorde mundial de velocidade de API de grandes modelos. Simultaneamente, foi lançado o nível de preço do GLM Coding Plan, que esgotou imediatamente após a abertura, e no mercado de capitais as ações da Zhipu subiram mais de 20% no pregão matinal de Hong Kong.
Fonte: Pingwest | Detalhes: https://www.pingwest.com/search/?q=GLM-5.1
🔥 Alibaba Tongyi Lança Qwen3.7-Plus: Compreensão de Tela Supera GPT-5.4, Desenvolvimento Independente de App em 11 Horas
O Tongyi Qianwen da Alibaba lançou o Qwen3.7-Plus, líder em avaliação de compreensão de tela em comparação com o GPT-5.4, e demonstrou o processo completo de desenvolvimento independente de um App pelo modelo em 11 horas, enfatizando a capacidade de ponta a ponta de "ver, pensar, escrever e fazer", avançando ainda mais no赛道 de AI Agent.
Fonte: Wall Street CN | Detalhes: https://wallstreetcn.com/search/?keyword=Qwen3.7-Plus
🔥 Baidu Wenxin Lança PaddleOCR-VL-1.6: Precisão de Análise de Documentos Ultrapassa 96,33%
A equipe Baidu Wenxin lançou o modelo de análise multimodal de documentos PaddleOCR-VL-1.6, que estabeleceu novos recordes em múltiplos benchmarks SOTA de compreensão de documentos, com precisão de 96,33%. Já está disponível para download no ecossistema PaddlePaddle e Wenxin, focado em cenários corporativos de OCR/inteligência documental.
Fonte: QbitAI | Detalhes: https://www.qbitai.com/search/?keywords=PaddleOCR-VL-1.6
🔥 Tencent Hunyuan Propõe Atenção Esparsa Stem: Latência do Primeiro Token Reduzida em 3,6x em Inferência de Textos Longos
A equipe Tencent Hunyuan propôs o algoritmo de atenção esparsa Stem, que reduz a latência do primeiro token em 3,6x na inferência de contextos longos. Foram alcançados novos SOTAs em tarefas de sumarização de textos longos e conclusão de código. O artigo e o código de inferência foram divulgados, mirando as dificuldades de落地 de modelos de linguagem grandes em contextos longos.
Fonte: Tencent Hunyuan | Detalhes: https://hunyuan.tencent.com/news
🔥 Tencent Hunyuan Lança Plugin de Memória Hy-Memory, Reformulando a Experiência de IA Colaborativa de Longo Prazo
A Tencent Hunyuan lançou o plugin de memória de longo prazo Hy-Memory, permitindo que assistentes de IA沉淀 preferências de usuários e contexto de projetos entre sessões. A empresa alega que pode aumentar a taxa de sucesso de tarefas colaborativas de 30 dias para 78%, fornecendo infraestrutura para "Agentes de IA Colaborativos".
Fonte: Tencent Hunyuan | Detalhes: https://hunyuan.tencent.com/news
🔥 Computação Doméstica Completa Pós-treinamento Completo de Modelo de IA de Trilhão de Parâmetros
Segundo o Securities Times, clusters de GPU domésticos já completaram com sucesso a tarefa de pós-treinamento completo de modelos de IA de trilhão de parâmetros. Isso representa uma conquista-chave na cadeia de treinamento de modelos grandes pela computação doméstica, reduzindo significativamente a dependência de GPUs premium estrangeiras.
来源:证券时报 | 详情:https://www.stcn.com/search/?keyword=%E5%9B%BD%E4%BA%A7%E7%AE%97%E5%8A%9B+%E4%B8%87%E4%BA%BF
🔥 Doubao vai entrar na era de cobrança, ByteDance busca novas curvas de crescimento para IA
O 36Kr revelou exclusivamente as quatro questões-chave de IA da ByteDance para 2026, com a Doubao oficialmente entrando na era de cobrança como um dos elementos importantes; simultaneamente, o ex-diretor da Seed Gu Quanquan saiu, e a equipe passou por reorganização focando em ToB, assinatura de modelos e fechamento do ciclo de monetização de IA.
Fonte: 36氪 | Detalhes:https://36kr.com/search/articles/%E8%B1%86%E5%8C%85%20%E6%94%B6%E8%B4%B9
🔥 DeepSeek conclui primeira rodada de financiamento de aproximadamente 500 bilhões de yuans, liderando o ranking de novas aquisições de empresas americanas
A DeepSeek está prestes a concluir sua primeira rodada de financiamento, com valor aproximado de 500 bilhões de yuans chineses; simultaneamente, ela lidera o ranking de novas aquisições de empresas americanas, tornando-se um produto de IA marcante para empresas chinesas no mercado internacional, e também um marco importante na monetização de grandes modelos domésticos.
Fonte: 凤凰网科技 | Detalhes:https://tech.ifeng.com/search/?keyword=DeepSeek+500%E4%BA%BF
Tendências Internacionais
🔥 Anthropic abre código aberto de estrutura de descoberta de vulnerabilidades de IA, apostandona engenharia de segurança de IA
A Anthropic disponibilizou em código aberto um *reference harness* para descoberta de vulnerabilidades impulsada por IA, permitindo que equipes de segurança corporativa integrem caçadores de vulnerabilidades de IA em processos de CI/CD e *red team*. O repositório já está disponível publicamente no GitHub, avançando na engenharia de pesquisas de segurança de IA.
Fonte: GitHub | Detalhes: https://github.com/anthropics/defending-code-reference-harness
🔥 Anthropic lança 《When AI Builds Itself》: Rumo à melhoria autorrecurvisa
O Anthropic Institute publicou um artigo no blog, apresentando os avanços mais recentes na direção de melhoria autorrecurvisa (*recursive self-improvement*), cobrindo autodepuração de modelos, avaliação automática e autogeração de dados de treinamento, respondendo às preocupações da indústria sobre a "autoevolução" da IA.
Fonte: Anthropic | Detalhes: https://www.anthropic.com/institute/recursive-self-improvement
🔥 Uber estabelece limite de US$ 1.500/mês para uso de IA: Sinal de precificação de ferramentas de IA do setor
Simon Willison escreveu um artigo analisando a decisão da Uber de estabelecer um limite de uso de US$ 1.500/mês para ferramentas internas de IA,,认为这是企业级 AI 编码/Agent 工具定价走向「硬性预算」的早期信号,也反映出 token 成本快速攀升的现实。认为这是企业级 AI 编码/Agent 工具定价走向「硬性预算」的早期信号,也反映出 token 成本快速攀升的现实。
Fonte: Simon Willison | Detalhes: https://simonwillison.net/2026/Jun/3/uber-caps-usage/
🔥 Alphabet announce 80 billion dollars in equity financing to expand AI computing power
The Alphabet announcement plans to raise 80 billion dollars through equity financing, focused on AI infrastructure, data centers and computing power expansion, strengthening the training and inference capabilities of Google Cloud and the Gemini model series.
Font: ABC News | Detalhes: https://abc.xyz/investor/news/news-details/2026/Alphabet-Announces-Proposed-80-Billion-Equity-Capita
🔥 Liquid AI releases LFM2.5-8B-A1B: MoE model trained on 38T tokens
Liquid AI releases the LFM2.5-8B-A1B mixture of experts model, with 8B total parameters, 1B activated, but with training data volume reaching 38T tokens, focusing on low-latency edge inference and high-quality code generation, open source download.
Font: Liquid AI | Detalhes: https://www.liquid.ai/blog/lfm2-5-8b-a1b
🔥 Stanford Law School research: AI beats law professors in legal tasks
The latest Stanford Law School research shows that mainstream large models have stably surpassed senior law professors in tasks such as contract review and legal text retrieval, sparking widespread discussion in legal education and the legal services industry, once again raising the discussion of "AI replacing white-collar workers".
Origem: Stanford Law | Detalhes: https://law.stanford.edu/press/ai-outperforms-law-professors-in-stanford-law-study/
🔥 Anthropic supera OpenAI e se torna a startup de IA mais valiosa do mundo
Segundo múltiplos relatórios, a Anthropic alcançou uma avaliação superior à da OpenAI nesta nova rodada de financiamento, tornando-se a startup de IA mais valiosa do mundo, com uma avaliação estimada em torno de 300 bilhões de dólares, intensificando o efeito Matthew entre as principais empresas de modelos de linguagem de grande escala.
Origem: Qazinform | Detalhes: https://qazinform.com/news/anthropic-surpasses-openai-to-become-worlds-most-valuable-ai-startup
Comentários