TradingKey - เมื่อวันที่ 29 กันยายนที่ผ่านมา DeepSeek ได้เปิดตัวโมเดลใหม่ชื่อว่า DeepSeek-V3.2-Exp พร้อมประกาศลดราคาค่าบริการ API อย่างเป็นทางการ โดยมีผลทันที ราคาค่าป้อนข้อมูลของ
DeepSeek-V3.2-Exp ถูกลดลงมากกว่า 50% ขณะที่ราคาค่าผลลัพธ์ลดลงถึง 75% เนื่องจากต้นทุนการให้บริการที่ลดลงตามโมเดลใหม่ ผู้เชี่ยวชาญในอุตสาหกรรมแนะนำว่ากลยุทธ์การตั้งราคานี้จะทำให้บริษัทอื่น ๆ แข่งขันในบริการที่คล้ายกันได้ยาก
นอกจากนี้ โมเดลนี้ยังถือเป็นความก้าวหน้าทางเทคโนโลยีหลักด้วยการแนะนำ DeepSeek Sparse Attention (DSA) ซึ่งเป็นการใช้กลไกความสนใจแบบบางละเอียดครั้งแรก DeepSeek อธิบายว่า V3.2-Exp เป็นโมเดลทดลองที่ทำหน้าที่เป็นขั้นตอนเปลี่ยนผ่านสู่สถาปัตยกรรมยุคถัดไป โดยสร้างขึ้นบนพื้นฐานของ V3.1-Terminus และได้นำกลไก DSA มาใช้เพื่อลดการใช้ทรัพยากรการคำนวณ ขณะเดียวกันยังเพิ่มประสิทธิภาพการอนุมานของโมเดล
จากการประเมินของ DeepSeek ระบุว่า V3.2-Exp สามารถทำงานได้ใกล้เคียงกับ V3.1-Terminus โดยมีการปรับปรุงประสิทธิภาพในการฝึกฝนและอนุมานข้อความยาวอย่างมีนัยสำคัญโดยไม่ลดทอนคุณภาพของผลลัพธ์
ปัจจุบันโมเดล V3.2-Exp เปิดเผยเป็นแหล่งข้อมูลสาธารณะบนแพลตฟอร์ม Huggingface และ Modu ขณะเดียวกันมีการคาดเดาว่าเวอร์ชัน V4 และ R2 ของ DeepSeek อาจยังไม่พร้อมเปิดตัวในเร็ว ๆ นี้
ทั้ง Huawei Cloud และ Cambricon ได้เสร็จสิ้นการรวมเข้ากับโมเดล DeepSeek-V3.2-Exp โดยที่ Huawei Cloud สามารถรองรับความยาวของบริบทสูงสุดถึง 160K สำหรับลำดับยาว
เนื้อหานี้แปลโดย AI ซึ่งอาจมีข้อผิดพลาดจากข้อจำกัดทางเทคโนโลยีและภาษา จึงไม่สามารถรับประกันความถูกต้อง และความสมบูรณ์ของเนื้อหาได้ทั้งหมด ในการนำข้อมูลไปใช้ โปรดอ้างอิงจากต้นฉบับ และใช้วิจารณญาณประกอบการตัดสินใจ ทั้งนี้ บริษัทฯ จะไม่รับผิดชอบต่อความเสียหายหรือความเข้าใจผิดใดๆ ที่เกิดขึ้นจากการใช้เนื้อหาดังกล่าว
DeepSeek-V3.2-Exp Model Launches with 75% Price Cut; Huawei Cloud and Cambricon Integration Complete