今月の概要
今週のAI分野で大きなニュースが続いています:国内大手LLM企業DeepSeekが700億元規模の資金調達を 발표し、AIプログラミングツールに参入、GPT-4.5が初のチューリングテスト合格(合格率71%で人間を超える)、智谷がグローバルAPI速度記録を更新、OpenAIがChatGPTをPowerPointに直接組み込み。以下、詳細解説です。
1. GPT-4.5が初のチューリングテスト合格、合格率71%で人間を超える
一言で言うと:GPT-4.5がクラシックなチューリングテストで合格率71%を達成、初めて人間の合格率(68%)を超え、AIが「完璧な嘘をつく」ことを学んだ。サンディエゴにあるカルフォルニア大学の研究チームが、厳密に設計されたチューリングテストを実施した。テストには200名の審査員を採用し、GPT-4.5、ELIZA(古典的なチャットボット)、本物の人間と同時に5分間会話し、どちらが人間かを判断した。
テスト結果:| 対象 | 合格率 | |
| GPT-4.5 | 71% | |
| 人間 | 68% | |
| ELIZA | 22% | |
| プラットフォーム | 速度 | 価格 |
| GLM-5.1高速版 | 400 tokens/s | ¥2/百万tokens |
| GPT-4.5 | ~50 tokens/s | $3.5/百万tokens |
国産のモデルは速度が速いだけでなく、価格も海外モデルの端数に過ぎません。智谷はCapCutと深度的に協力し、Gemini統合ソリューション,推出しています。
4. OpenAIがPowerPoint向けChatGPTを発表:一つの文でPPTを生成
ワンフレーズ:OpenAIがAIをPowerPointに直接組み込み、一つの文でPPTを生成します。免费ユーザーは每月10回、Plusユーザーは無制限に使用可能です。このプラグインは以下に対応しています:
- 自然言語による一つの文での完全なPPT生成
- ワンボタンでの美麗なレイアウト
- Gmail、Outlookからの素材抽出
- 主动的にBugを検出:PPT内の論理的漏洞、データ不整合、フォーマットエラーを自動的に検出
安全メカニズム:高リスク操作にはユーザーの二次確認が必要です。
業界評価:PPT業界は「インテリジェントエージェント協調」時代に突入し、従来のPPT制作プロセスは覆されるでしょう。
來週の展望
- DeepSeek Code の詳細発表
- 国産大規模言語モデルの価格競争の継続
- AIプログラミングツール賽道の競争激化
- チューリングテストの結果によるAI規制議論
この栏目について
毎週土曜日に更新し、1週間のAIホットニュースを汇总し、開発者とAIプログラミング愛好家に焦点を当てます。
質問やご提案があれば?コメント欄にお寄せください。
コメント