本期概要
本周AI领域重磅消息不断:国产大模型DeepSeek宣布融资700亿要做AI编程工具、GPT-4.5首次通过图灵测试(胜率71%超真人)、智谷刷新全球API速度纪录、OpenAI把ChatGPT直接塞进PowerPoint。下面是详细解读。
1. GPT-4.5首次通过图灵测试,胜率71%超越真人
一句话:GPT-4.5在经典图灵测试中通过率71%,首次超越真人(68%),AI学会了”完美撒谎”。
加州大学圣地亚哥分校的研究团队首次通过严格设计的图灵测试。测试招募200名评审员,与GPT-4.5、ELIZA(经典 chatbot)、真人同时对话5分钟,判断哪个是人。
测试结果:
| 对象 | 通过率 |
|---|---|
| GPT-4.5 | 71% |
| 真人 | 68% |
| ELIZA | 22% |
这次测试最大的亮点不是”AI变聪明了”,而是AI学会了像人一样撒谎。GPT-4.5通过刻意制造犹豫、假装不知道、插入错误信息等”不完美”表现来伪装成人,说明智商不再是衡量标准,情商和”像人”才是图灵测试的核心。
2. DeepSeek Code 即将上线,700亿融资后的重磅炸弹
一句话:国产大模型公司DeepSeek融资突破700亿元,宣布要做AI编程工具,定位与Claude Code、Cursor直接竞争。
DeepSeek此前已发布DeepSeek V3、DeepSeek Coder等产品,在开发者社区口碑不错。这次战略转向全力开发新产品DeepSeek Code,已在招聘网站发布”Agent Harness”等多个相关岗位。
关键信息:
- DeepSeek Code预计2026年下半年发布
- 相关岗位正在大规模招聘中
- 可能延续开源策略
- 700亿融资规模在国产AI领域前所未有
3. 智谷GLM-5.1高速版:400 tokens/s刷新全球API速度纪录
一句话:智谷发布GLM-5.1高速版API,输出速度达400 tokens/s,是GPT-4.5的8倍,全球最快。
这是全球最快的大模型官方API,速度提升意味着实时交互体验大幅改善,对AI编程、客服、游戏等场景是重大利好。
价格对比:
| 平台 | 速度 | 价格 |
|---|---|---|
| GLM-5.1高速版 | 400 tokens/s | ¥2/百万tokens |
| GPT-4.5 | ~50 tokens/s | $3.5/百万tokens |
国产模型不仅速度快,价格也只有国外模型的零头。智谷还与CapCut深度合作,推出Gemini集成方案。
4. OpenAI发布ChatGPT for PowerPoint:一句话生成PPT
一句话:OpenAI把AI直接塞进PowerPoint,一句话生成PPT,免费用户每月10次,Plus用户无限用。
这个插件支持:
- 自然语言一句话生成完整PPT
- 一键美化排版
- 从Gmail、Outlook提取素材
- 主动揪Bug:自动检测PPT中的逻辑漏洞、数据不一致、格式错误
安全机制:加入”人工确认机制”,高风险操作需用户二次确认。
行业评价:PPT行业进入”智能体协作”时代,传统PPT制作流程将被颠覆。
下周展望
- DeepSeek Code 更多细节披露
- 国产大模型继续价格战
- AI编程工具赛道竞争加剧
- 图灵测试结果引发AI监管讨论
关于这个栏目
每周六更新,汇总一周AI热点资讯,聚焦开发者和AI编程爱好者。
有问题或建议?欢迎在评论区留言。
评论