Resumen de esta edición

Esta semana ha estado llena de noticias importantes en el campo de la IA: el modelo grande nacional DeepSeek anunció una recaudación de fondos de 70 mil millones para crear herramientas de programación de IA, GPT-4.5 superó por primera vez la prueba de Turing (tasa de aprobación del 71% superando a los humanos), Zhigu batió el récord mundial de velocidad de API, y OpenAI integró ChatGPT directamente en PowerPoint. A continuación, el análisis detallado.


1. GPT-4.5 superó por primera vez la prueba de Turing, con una tasa de aprobación del 71% superando a los humanos

En una frase: GPT-4.5 logró una tasa de aprobación del 71% en la prueba clásica de Turing, superando por primera vez a los humanos (68%), y la IA ha aprendido a "mentir perfectamente".

Un equipo de investigación de la Universidad de California en San Diego logró este hito mediante una prueba de Turing estrictamente diseñada. El estudio contrató a 200 evaluadores que mantuvieron conversaciones de 5 minutos simultáneamente con GPT-4.5, ELIZA (un chatbot clásico) y humanos reales, determinando cuál de ellos era humano.

Resultados de la prueba:

El mayor logro de esta prueba no es que "la IA se volvió más inteligente", sino que la IA aprendió a mentir como un humano. GPT-4.5 se hizo pasar por humano mediante la creación deliberada de dudas, fingiendo no saber, insertando información errónea y otras表现 "imperfectas", lo que demuestra que el coeficiente intelectual ya no es el estándar de medición; la inteligencia emocional y "parecer humano" son el núcleo de la prueba de Turing.


2. DeepSeek Code se lançará pronto, la bomba de重量 después de la herramient de 70 mil millones

En una frase: La empresa de modelos grandes nacionales DeepSeek superó una herramient de 70 mil millones de yuanes, anunciando que desarrollará herramientas de programación de IA, compitiendo directamente con Claude Code y Cursor.

DeepSeek ya ha lanzado productos como DeepSeek V3 y DeepSeek Coder, ganando una buena reputación en la comunidad de desarrolladores. Esta vez, el cambio estratégico se enfoca en desarrollar completamente el nuevo producto DeepSeek Code, y ya ha publicado ofertas de trabajo relacionadas en sitios de reclutamiento, como "Agent Harness" y otros puestos relevantes.

Información clave:

3. GLM-5.1 Versión de Alta Velocidad de Zhigu: 400 tokens/s bate el récord mundial de velocidad de API

En una frase: Zhigu lanza la API de alta velocidad GLM-5.1, con una velocidad de salida de 400 tokens/s, 8 veces más rápida que GPT-4.5, la más rápida del mundo.

Esta es la API oficial de modelos de lenguaje más rápida del mundo. El aumento de velocidad significa una mejora considerable en la experiencia de interacción en tiempo real, lo cual es una gran noticia para escenarios como programación con IA, servicio al cliente y juegos.

Comparación de precios:
SujetoTasa de aprobación
GPT-4.571%
Humanos68%
ELIZA22%
PlataformaVelocidadPrecio
GLM-5.1 Alta Velocidad400 tokens/s¥2/millón de tokens
GPT-4.5~50 tokens/s$3.5/millón de tokens

Los modelos nacionales no solo son más rápidos, sino que su precio también es solo una fracción del de los modelos extranjeros. Zhigu también ha establecido una colaboración profunda con CapCut, lanzando un esquema de integración con Gemini.


4. OpenAI lanza ChatGPT for PowerPoint: Genera PPT con una sola frase

En una frase: OpenAI integra IA directamente en PowerPoint, generando presentaciones con una sola frase. Usuarios gratuitos: 10 veces al mes; usuarios Plus: uso ilimitado.

Este plugin supports:

Mecanismo de seguridad: Se añade un "mecanismo de confirmación humana", las operaciones de alto riesgo requieren una segunda confirmación del usuario.

Evaluación de la industria: La industria de PPT entra en la era de "colaboración con agentes inteligentes", el proceso tradicional de creación de PPT será revolucionado.



Perspectivas para la próxima semana


Sobre esta columna

Se actualiza cada sábado, resumiendo las noticias más importantes de IA de la semana, enfocado en desarrolladores y entusiastas de la programación con IA.

¿Tienes preguntas o sugerencias? ¡Deja un comentario!