โมเดล AI จีน “DeepSeek-R1” ท้าชน OpenAI อ้างเก่งเทียบชั้น o1 แต่ถูกกว่าเป็น 10 เท่า

DeepSeek แล็บ AI จากจีน ประกาศเปิดตัว DeepSeek-R1 โมเดล AI แบบโอเพนซอร์สที่เน้น “การให้เหตุผล” (Reasoning) โดยอ้างว่ามีประสิทธิภาพเทียบเท่าหรือเหนือกว่าโมเดล o1 ของ OpenAI ใน Benchmark บางด้าน

เว็บไซต์เทคครันช์ (techcrunch) รายงานวันนี้ (21 ม.ค.) ว่า R1 พร้อมใช้งานแล้วบนแพลตฟอร์ม Hugging Face ภายใต้ใบอนุญาต MIT ทำให้ใครก็สามารถนำไปใช้เชิงพาณิชย์ได้โดยไม่มีข้อจำกัด

DeepSeek เคลมว่า R1 เอาชนะ o1 ใน Benchmark อย่าง AIME (การประเมินประสิทธิภาพโมเดลโดยใช้โมเดลอื่น), MATH-500 (โจทย์ปัญหาคณิตศาสตร์) และ SWE-bench Verified (งานเขียนโปรแกรม)

จุดเด่นของ R1 คือความสามารถในการให้เหตุผล ซึ่งหมายความว่ามันสามารถตรวจสอบความถูกต้องของตัวเองได้ ช่วยลดข้อผิดพลาดที่มักพบในโมเดล AI ทั่วไป แม้จะใช้เวลาประมวลผลนานกว่าเล็กน้อย (ไม่กี่วินาทีไปจนถึงหลายนาที) แต่ R1 ก็ให้คำตอบที่แม่นยำและน่าเชื่อถือกว่า โดยเฉพาะในสาขาฟิสิกส์ วิทยาศาสตร์ และคณิตศาสตร์

DeepSeek-R1 มีขนาดถึง 6.71 แสนล้านพารามิเตอร์ ซึ่งบ่งบอกถึงความสามารถในการแก้ปัญหาที่ซับซ้อน นอกจากนี้ DeepSeek ยังปล่อย R1 เวอร์ชัน “ย่อส่วน” (Distilled) ที่มีขนาดเล็กลง โดยมีให้เลือกตั้งแต่ขนาด 1.5 พันล้าน ถึง 7 หมื่นล้านพารามิเตอร์ โดยเวอร์ชันเล็กสุดสามารถใช้งานบนแล็ปท็อปได้ ส่วนเวอร์ชันเต็มนั้นต้องใช้เครื่องที่แรงกว่า แต่ก็มี API ให้บริการในราคาที่ถูกกว่า o1 ของ OpenAI ถึง 90-95%

อย่างไรก็ดี เนื่องจากเป็นโมเดลจากจีน R1 จึงถูกควบคุมโดยหน่วยงานกำกับดูแลอินเทอร์เน็ตของจีน การตอบสนองจึงต้อง “สะท้อนค่านิยมหลักของสังคมนิยม” ดังนั้น R1 จะไม่ตอบคำถามเกี่ยวกับประเด็นอ่อนไหวทางการเมือง เช่น เหตุการณ์ที่จัตุรัสเทียนอันเหมิน หรือการปกครองตนเองของไต้หวัน นี่เป็นข้อจำกัดที่พบได้ทั่วไปในระบบ AI ของจีนหลาย ๆ ตัว

การเปิดตัว R1 เกิดขึ้นท่ามกลางความพยายามของรัฐบาลสหรัฐฯ ที่จะจำกัดการส่งออกเทคโนโลยี AI ไปยังจีน บริษัทจีนถูกห้ามซื้อชิป AI ขั้นสูงอยู่แล้ว และกฎใหม่ที่กำลังจะออกมาจะยิ่งจำกัดการเข้าถึงเทคโนโลยีและโมเดลที่จำเป็นต่อการพัฒนาระบบ AI ล้ำสมัย

OpenAI เองก็ออกมาเรียกร้องให้รัฐบาลสหรัฐฯ สนับสนุนการพัฒนา AI ในประเทศ เพื่อป้องกันไม่ให้โมเดล AI ของจีนแซงหน้า คริส เลเฮน รองประธานฝ่ายนโยบายของ OpenAI กล่าวในการให้สัมภาษณ์ว่า High Flyer Capital Management ซึ่งเป็นบริษัทแม่ของ DeepSeek เป็นบริษัทที่น่าจับตามองเป็นพิเศษ

ปัจจุบันมีแล็บ AI ของจีนอย่างน้อย 3 แห่ง คือ DeepSeek, Alibaba และ Kimi (ของ Moonshot AI) ที่อ้างว่ามีโมเดลที่แข่งขันกับ o1 ได้แล้ว ทั้งนี้ ดีน บอล นักวิจัย AI จากมหาวิทยาลัยจอร์จเมสัน แสดงความเห็นผ่านทางเอ็กซ์ (ทวิตเตอร์) ว่า “โมเดล Distilled ของ DeepSeek เก่งมากนะ แปลว่าต่อไปเราจะได้เห็น AI ที่ให้เหตุผลเก่ง ๆ แบบนี้อีกเยอะเลย และจะรันบนคอมพิวเตอร์ทั่วไปได้ด้วย ทำให้ยากที่รัฐบาลไหนจะมาควบคุม”

โดย สำนักข่าวอินโฟเควสท์ (21 ม.ค. 68)

Tags: , , , ,