Resumen de esta edición
Esta semana ha estado llena de noticias importantes en el campo de la IA: el modelo grande nacional DeepSeek anunció una recaudación de fondos de 70 mil millones para crear herramientas de programación de IA, GPT-4.5 superó por primera vez la prueba de Turing (tasa de aprobación del 71% superando a los humanos), Zhigu batió el récord mundial de velocidad de API, y OpenAI integró ChatGPT directamente en PowerPoint. A continuación, el análisis detallado.
1. GPT-4.5 superó por primera vez la prueba de Turing, con una tasa de aprobación del 71% superando a los humanos
En una frase: GPT-4.5 logró una tasa de aprobación del 71% en la prueba clásica de Turing, superando por primera vez a los humanos (68%), y la IA ha aprendido a "mentir perfectamente".Un equipo de investigación de la Universidad de California en San Diego logró este hito mediante una prueba de Turing estrictamente diseñada. El estudio contrató a 200 evaluadores que mantuvieron conversaciones de 5 minutos simultáneamente con GPT-4.5, ELIZA (un chatbot clásico) y humanos reales, determinando cuál de ellos era humano.
Resultados de la prueba:| Sujeto | Tasa de aprobación | |
| GPT-4.5 | 71% | |
| Humanos | 68% | |
| ELIZA | 22% | |
| Plataforma | Velocidad | Precio |
| GLM-5.1 Alta Velocidad | 400 tokens/s | ¥2/millón de tokens |
| GPT-4.5 | ~50 tokens/s | $3.5/millón de tokens |
Los modelos nacionales no solo son más rápidos, sino que su precio también es solo una fracción del de los modelos extranjeros. Zhigu también ha establecido una colaboración profunda con CapCut, lanzando un esquema de integración con Gemini.
4. OpenAI lanza ChatGPT for PowerPoint: Genera PPT con una sola frase
En una frase: OpenAI integra IA directamente en PowerPoint, generando presentaciones con una sola frase. Usuarios gratuitos: 10 veces al mes; usuarios Plus: uso ilimitado.Este plugin supports:
- Generación completa de PPT con una frase en lenguaje natural
- Diseño y formato con un clic
- Extracción de materiales desde Gmail y Outlook
- Detección proactiva de errores: detecta automáticamente fallos lógicos, inconsistencias de datos y errores de formato en el PPT
Mecanismo de seguridad: Se añade un "mecanismo de confirmación humana", las operaciones de alto riesgo requieren una segunda confirmación del usuario.
Evaluación de la industria: La industria de PPT entra en la era de "colaboración con agentes inteligentes", el proceso tradicional de creación de PPT será revolucionado.
Perspectivas para la próxima semana
- Se revelarán más detalles sobre DeepSeek Code
- Los modelos de lenguaje nacionales continuarán la guerra de precios
- Se intensificará la competencia en el赛道 de herramientas de programación con IA
- Los resultados del Test de Turing provocarán discusiones sobre regulación de IA
Sobre esta columna
Se actualiza cada sábado, resumiendo las noticias más importantes de IA de la semana, enfocado en desarrolladores y entusiastas de la programación con IA.
¿Tienes preguntas o sugerencias? ¡Deja un comentario!
Comentarios