tradingkey.logo

โมเดลภาษาขนาดเล็ก (SLM) ได้รับการขนานนามว่าเป็นสิ่งยิ่งใหญ่ถัดไปใน AI

Cryptopolitan25 พ.ย. 2024 เวลา 20:11

ในขณะที่เทคโนโลยียักษ์ใหญ่เหล่านี้และอื่นๆ กำลังลงทุนหลายพันล้านดอลลาร์โดยมุ่งเน้นไปที่การพัฒนา LLM ขนาดใหญ่เพื่อจัดการกับงานต่างๆ มากมาย ความเป็นจริงของ AI ก็คือไม่มีขนาดใดที่เหมาะกับทุกคน เนื่องจากจำเป็นต้องมีโมเดลเฉพาะงานสำหรับธุรกิจ

ตามที่ Matt Garman ประธานเจ้าหน้าที่บริหารของ AWS กล่าวในการเผยแพร่เกี่ยวกับการขยายความร่วมมือและการลงทุนของพวกเขา มีการตอบรับอย่างท่วมท้นจากลูกค้า AWS ที่กำลังพัฒนา generative AI ที่ขับเคลื่อนโดย Anthropic

LLM สำหรับบริษัทส่วนใหญ่ยังคงเป็นตัวเลือกอันดับหนึ่งสำหรับบางโครงการ แต่สำหรับโครงการอื่นๆ ตัวเลือกนี้อาจมีราคาแพงในด้านต้นทุน พลังงาน และทรัพยากรการประมวลผล

Steven McMillan dent และซีอีโอของ Teradata ซึ่งเป็นผู้เสนอ ทางเลือก ให้กับธุรกิจบางแห่งก็มีมุมมองอื่นเช่นกัน เขามั่นใจว่าอนาคตอยู่ใน SLM

“เมื่อเรามองไปสู่อนาคต เราคิดว่าโมเดลภาษาขนาดเล็กและขนาดกลางและสภาพแวดล้อมที่มีการควบคุม เช่น LLM เฉพาะโดเมน จะให้โซลูชันที่ดีกว่ามาก”

~ แมคมิลแลน

SLM สร้างเอาต์พุตแบบกำหนดเอง สำหรับข้อมูลบางประเภท เนื่องจากโมเดลภาษาได้รับการฝึกฝนมาโดยเฉพาะเพื่อให้ทำเช่นนั้น เนื่องจากข้อมูลที่สร้างโดย SLM จะถูกเก็บไว้ภายใน โมเดลภาษาจึงได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่อาจละเอียดอ่อน

เนื่องจาก LLM ใช้พลังงานอย่างสิ้นเปลือง เวอร์ชันภาษาขนาดเล็กจึงได้รับการฝึกอบรมเพื่อปรับขนาดทั้งการประมวลผลและการใช้พลังงานให้ตรงกับความต้องการที่แท้จริงของโครงการ ด้วยการปรับเปลี่ยนดังกล่าว หมายความว่า SLM จะมีประสิทธิภาพด้วยต้นทุนที่ต่ำกว่ารุ่นขนาดใหญ่ในปัจจุบัน

สำหรับผู้ใช้ที่ต้องการใช้ AI เพื่อความรู้เฉพาะ มีตัวเลือกของ LLM เฉพาะโดเมน เนื่องจากไม่ได้ให้ความรู้ในวงกว้าง ได้รับการฝึกฝนให้เข้าใจข้อมูลเพียงประเภทเดียวอย่างลึกซึ้ง และตอบสนองได้แม่นยำมากขึ้น เช่น CMO กับ CFO ในโดเมนนั้น

เหตุใด SLM จึงเป็นตัวเลือกที่ต้องการ

ตามที่สมาคมนักวิทยาศาสตร์ข้อมูล (ADASci) พัฒนา SLM อย่างเต็มรูปแบบด้วยพารามิเตอร์ 7 พันล้านพารามิเตอร์สำหรับผู้ใช้หนึ่งล้านคน ต้องใช้พลังงานเพียง 55.1MWh (เมกะวัตต์ชั่วโมง)

ADaSci พบว่าการฝึกอบรม GPT-3 ด้วยพารามิเตอร์ 175 พันล้านพารามิเตอร์ใช้พลังงานไฟฟ้าประมาณ 1,287MWh และกำลังไฟฟ้าไม่รวมเมื่อเปิดให้สาธารณะใช้งานอย่างเป็นทางการ ดังนั้น SLM จึงใช้พลังงานประมาณ 5% ที่ใช้ไปผ่านการฝึกอบรม LLM

โมเดลขนาดใหญ่มักจะทำงานบนคอมพิวเตอร์ระบบคลาวด์เนื่องจากใช้พลังงานในการประมวลผลมากกว่าที่เคยมีในอุปกรณ์แต่ละเครื่อง สิ่งนี้ส่งผลให้เกิดความยุ่งยากสำหรับบริษัทต่างๆ เนื่องจากพวกเขาสูญเสียการควบคุมข้อมูลของตนในขณะที่ข้อมูลถูกย้ายไปยังระบบคลาวด์ และการตอบสนองที่ช้าในขณะที่พวกเขาเดินทางผ่านอินเทอร์เน็ต

ในอนาคต การนำ AI มาใช้โดยธุรกิจต่างๆ จะไม่ได้มีขนาดเดียวสำหรับทุกคนเนื่องจากประสิทธิภาพ และการเลือกเครื่องมือที่ดีที่สุดและราคาถูกที่สุดในการทำงานให้สำเร็จ ซึ่งหมายถึงการเลือกแบบจำลองขนาดที่เหมาะสมสำหรับแต่ละโครงการ

ซึ่งจะทำกับทุกรุ่น ไม่ว่าจะเป็น LLM สำหรับการใช้งานทั่วไป หรือ LLM ที่เล็กกว่าและเฉพาะโดเมน ขึ้นอยู่กับว่ารุ่นใดจะให้ผลลัพธ์ที่ดีกว่า ต้องการทรัพยากรน้อยลง และลดความจำเป็นในการย้ายข้อมูลไปยัง ระบบคลาวด์

ในระยะต่อไป AI จะมีความสำคัญต่อการตัดสินใจทางธุรกิจ เนื่องจากประชาชนมีความมั่นใจสูงในคำตอบที่สร้างโดย AI

“เมื่อคุณคิดถึงการฝึกโมเดล AI โมเดลเหล่านั้นจะต้องสร้างขึ้นบนพื้นฐานของข้อมูลที่ยอดเยี่ยม”

~ แมคมิลแลน

“นั่นคือสิ่งที่เราทุกคนเป็น โดยการจัดหาชุดข้อมูลที่เชื่อถือได้ จากนั้นมอบความสามารถและความสามารถในการวิเคราะห์ เพื่อให้ลูกค้าและลูกค้าของพวกเขาสามารถไว้วางใจผลลัพธ์ที่ได้” McMillan กล่าวเสริม

ด้วยประสิทธิภาพและความแม่นยำที่เป็นที่ต้องการสูงในโลก LLM ขนาดเล็กและเฉพาะโดเมนจึงเสนอทางเลือกอื่นในการมอบผลลัพธ์ที่บริษัทและสาธารณชนในวงกว้างสามารถไว้วางใจได้

จากศูนย์ถึง Web3 Pro: แผนเปิดตัวอาชีพ 90 วันของคุณ

ข้อจำกัดความรับผิดชอบ: ข้อมูลที่ให้ไว้บนเว็บไซต์นี้มีไว้เพื่อวัตถุประสงค์ทางการศึกษาและให้ข้อมูลเท่านั้น และไม่ควรถือเป็นคำแนะนำทางการเงินหรือการลงทุน

บทความที่เกี่ยวข้อง

KeyAI