Обзор выпуска
На этой неделе в сфере ИИ громкие новости продолжают поступать: отечественная большая модель DeepSeek объявила о привлечении финансирования в размере 70 млрд юаней для создания инструмента программирования на базе ИИ, GPT-4.5 впервые прошел тест Тьюринга (71% прохождения — выше, чем у человека), Zhigu продемонстрировала новый мировой рекорд скорости API, а OpenAI интегрировала ChatGPT напрямую в PowerPoint. Ниже приводится подробный анализ.
1. GPT-4.5 впервые прошел тест Тьюринга, процент прохождения 71% превзошел человека
В одном предложении: GPT-4.5 показал 71% прохождения в классическом тесте Тьюринга, впервые превзойдя человека (68%). ИИ научился «идеально врать».Исследовательская группа Калифорнийского университета в Сан-Диего впервые провела строго разработанный тест Тьюринга. В тестировании участвовали 200 экспертов-оценщиков, которые одновременно вели 5-минутные диалоги с GPT-4.5, ELIZA (классический чат-бот) и реальным человеком, определяя, кто из них является человеком.
Результаты тестирования:| Объект | Процент прохождения | |
| GPT-4.5 | 71% | |
| Человек | 68% | |
| ELIZA | 22% | |
| Платформа | Скорость | Цена |
| GLM-5.1 высокоскоростной | 400 tokens/s | ¥2/миллион tokens |
| GPT-4.5 | ~50 tokens/s | $3.5/миллион tokens |
Отечественная модель не только быстрая, но и стоит лишь малую долю от зарубежных моделей. ZhiGu также глубоко сотрудничает с CapCut, представляя интеграционное решение Gemini.
4. OpenAI выпустила ChatGPT for PowerPoint: создание PPT одной фразой
Одной фразой: OpenAI встроила AI прямо в PowerPoint — создание PPT одной фразой, бесплатные пользователи получают 10 раз в месяц, Plus-пользователи — без ограничений.Этот плагин поддерживает:
- Создание полной PPT одной фразой на естественном языке
- Один клик для улучшения форматирования
- Извлечение материалов из Gmail, Outlook
- Активный поиск багов: автоматическое обнаружение логических уязвимостей, несоответствий данных, ошибок форматирования в PPT
Механизм безопасности: добавлена «система подтверждения человеком», рискованные операции требуют повторного подтверждения пользователя.
Отраслевая оценка: индустрия PPT вступает в эпоху «коллаборации интеллектуальных агентов», традиционный процесс создания PPT будет颠覆.
Ожидания на следующую неделю
- DeepSeek Code — раскрытие дополнительных деталей
- Ценовая война среди отечественных больших моделей продолжается
- Усиление конкуренции в сегменте AI-программирования
- Результаты теста Тьюринга вызывают дискуссии об AI-регулировании
О рубрике
Обновляется каждую субботу, собирая недельные AI-новости, ориентированные на разработчиков и любителей AI-программирования.
Есть вопросы или предложения? Добро пожаловать в комментарии!
Комментарии