Resumo desta Edição
As notícias importantes da área de IA esta semana não param de aparecer: a empresa nacional de grandes modelos DeepSeek anunciou uma captação de 700 bilhões para desenvolver ferramentas de programação de IA, o GPT-4.5 passou no teste de Turing pela primeira vez (taxa de sucesso de 71%, superando humanos), a Zhipu quebrou o recorde mundial de velocidade de API, e a OpenAI integrou o ChatGPT diretamente no PowerPoint. A seguir, a análise detalhada.
1. GPT-4.5 Passa no Teste de Turing pela Primeira Vez, Taxa de Sucesso de 71% Supera Humanos
Em resumo: O GPT-4.5 alcançou uma taxa de aprovação de 71% no teste clássico de Turing, superando humanos pela primeira vez (68%), e a IA aprendeu a "mentir perfeitamente".A equipe de pesquisa da Universidade da Califórnia em San Diego foi a primeira a conduzir um teste de Turing com design rigoroso. O teste recrutou 200 avaliadores que conversaram simultaneamente com o GPT-4.5, ELIZA (um chatbot clássico) e um humano real por 5 minutos, tentando identificar quem era humano.
Resultados do teste:| Objeto | Taxa de Aprovação | |
| GPT-4.5 | 71% | |
| Humano | 68% | |
| ELIZA | 22% | |
| Plataforma | Velocidade | Preço |
| GLM-5.1 alta velocidade | 400 tokens/s | ¥2/milhão de tokens |
| GPT-4.5 | ~50 tokens/s | $3.5/milhão de tokens |
Os modelos domésticos não apenas são rápidos, mas também custam apenas uma fração dos modelos estrangeiros. A Zhigu também colaborou profundamente com a CapCut para lançar uma solução de integração Gemini.
4. OpenAI lança ChatGPT for PowerPoint: Gere PPT com uma frase
Uma frase: A OpenAI integrou IA diretamente no PowerPoint, gerando PPT com uma frase. Usuários gratuitos têm 10 usos por mês, usuários Plus têm uso ilimitado.Este plugin suporta:
- Geração completa de PPT com uma frase em linguagem natural
- Um clique para embelezar formatação
- Extração de materiais do Gmail, Outlook
- Detecção proativa de Bugs: detecta automaticamente falhas lógicas, inconsistências de dados e erros de formatação no PPT
Mecanismo de segurança: Implementa "mecanismo de confirmação humana", operações de alto risco exigem confirmação secundária do usuário.
Avaliação da indústria: A indústria de PPT entra na "era de colaboração de agentes inteligentes", o processo tradicional de criação de PPT será revolucionado.
Próxima semana
- Mais detalhes sobre o DeepSeek Code
- Modelos domésticos de grande escala continuam a guerra de preços
- Concorrência acirrada no赛道 de ferramentas de programação de IA
- Discussões sobre regulamentação de IA após resultados do teste de Turing
Sobre esta coluna
Atualizada aos sábados, reunindo as principais notícias de IA da semana, focando em desenvolvedores e entusiastas de programação de IA.
Dúvidas ou sugestões? Deixe um comentário.
Comentários