สรุปประจำฉบับนี้
ข่าวสำคัญในวงการ AI สัปดาห์นี้มีมากมาย: บริษัทโมเดล AI ขนาดใหญ่จากจีน DeepSeek ประกาศระดมทุน 700 พันล้านเพื่อพัฒนาเครื่องมือเขียนโค้ด AI, GPT-4.5 ผ่านการทดสอบทัวริงเป็นครั้งแรก (อัตราชนะ 71% เหนือมนุษย์), บริษัท Zhigu ทำลายสถิติความเร็ว API ระดับโลก, OpenAI นำ ChatGPT เข้าไปใส่ใน PowerPoint โดยตรง ต่อไปนี้คือรายละเอียด
1. GPT-4.5 ผ่านการทดสอบทัวริงเป็นครั้งแรก อัตราชนะ 71% เหนือมนุษย์
สรุปหนึ่งประโยค: GPT-4.5 มีอัตราผ่านการทดสอบทัวริงแบบคลาสสิก 71% เป็นครั้งแรกที่เหนือมนุษย์ (68%) ปัญญาประดิษฐ์ได้เรียนรู้ "การโกหกอย่างสมบูรณ์แบบ"ทีมวิจัยจากมหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก ได้ดำเนินการทดสอบทัวริงด้วยการออกแบบที่เข้มงวดเป็นครั้งแรก การทดสอบระดมผู้ประเมิน 200 คนให้สนทนากับ GPT-4.5, ELIZA (แชทบอทคลาสสิก), และมนุษย์จริงพร้อมกัน 5 นาที เพื่อตัดสินว่าอันไหนเป็นมนุษย์
ผลการทดสอบ:| วัตถุ | อัตราผ่าน | |
| GPT-4.5 | 71% | |
| มนุษย์ | 68% | |
| ELIZA | 22% | |
| แพลตฟอร์ม | ความเร็ว | ราคา |
| GLM-5.1 High-Speed | 400 tokens/s | ¥2/ล้าน tokens |
| GPT-4.5 | ~50 tokens/s | $3.5/ล้าน tokens |
โมเดลในประเทศไม่เพียงแต่เร็วกว่า แต่ราคาก็ถูกกว่าโมเดลต่างชาติมาก จื่อกู่ยังร่วมมือกับ CapCut อย่างลึกซึ้ง เปิดตัวแผนการผสานรวม Gemini
4. OpenAI เปิดตัว ChatGPT for PowerPoint: สร้าง PPT ด้วยประโยคเดียว
สรุป: OpenAI นำ AI เข้าไปใส่ใน PowerPoint โดยตรง สร้าง PPT ด้วยประโยคเดียว ผู้ใช้ฟรี 10 ครั้ง/เดือน ผู้ใช้ Plus ใช้ไม่จำกัดปลั๊กอินนี้รองรับ:
- สร้าง PPT ฉบับสมบูรณ์จากประโยคภาษาธรรมชาติเพียงประโยคเดียว
- ตกแต่งและจัดวางรูปแบบด้วยคลิกเดียว
- ดึงเนื้อหาจาก Gmail, Outlook
- ตรวจจับ Bug แบบ proactive: ตรวจหาช่องโหว่ทางตรรกะ, ความไม่สอดคล้องของข้อมูล, ข้อผิดพลาดของรูปแบบใน PPT โดยอัตโนมัติ
กลไกความปลอดภัย: เพิ่ม "กลไกการยืนยันโดยมนุษย์" การดำเนินการที่มีความเสี่ยงสูงต้องได้รับการยืนยันจากผู้ใช้อีกครั้ง
การประเมินในอุตสาหกรรม: อุตสาหกรรม PPT เข้าสู่ยุค "การทำงานร่วมกับ Intelligent Agent" กระบวนการสร้าง PPT แบบดั้งเดิมจะถูกเปลี่ยนแปลง
มองไปข้างหน้าสัปดาห์หน้า
- รายละเอียดเพิ่มเติมของ DeepSeek Code
- สงครามราคาของโมเดลในประเทศยังคงดำเนินต่อไป
- การแข่งขันในสายเครื่องมือ AI programming ทวีความรุนแรง
- ผลการทดสอบ Turing กระตุ้นการอภิปรายเกี่ยวกับการกำกับดูแล AI
เกี่ยวกับคอลัมน์นี้
อัปเดตทุกวันเสาร์ รวบรวมข่าว AI热点 ประจำสัปดาห์ มุ่งเน้นนักพัฒนาและผู้ที่ชื่นชอบ AI programming
มีคำถามหรือข้อเสนอแนะ? ยินดีต้อนรับความคิดเห็นในคอมเมนต์
ความคิดเห็น