tradingkey.logo

โมเดลภาษาขนาดเล็ก (SLM) ได้รับการขนานนามว่าเป็นสิ่งยิ่งใหญ่ถัดไปใน AI

Cryptopolitan25 พ.ย. 2024 เวลา 20:11

ในขณะที่เทคโนโลยียักษ์ใหญ่เหล่านี้และอื่นๆ กำลังลงทุนหลายพันล้านดอลลาร์โดยมุ่งเน้นไปที่การพัฒนา LLM ขนาดใหญ่เพื่อจัดการกับงานต่างๆ มากมาย ความเป็นจริงของ AI ก็คือไม่มีขนาดใดที่เหมาะกับทุกคน เนื่องจากจำเป็นต้องมีโมเดลเฉพาะงานสำหรับธุรกิจ

ตามที่ Matt Garman ประธานเจ้าหน้าที่บริหารของ AWS กล่าวในการเผยแพร่เกี่ยวกับการขยายความร่วมมือและการลงทุนของพวกเขา มีการตอบรับอย่างท่วมท้นจากลูกค้า AWS ที่กำลังพัฒนา generative AI ที่ขับเคลื่อนโดย Anthropic

LLM สำหรับบริษัทส่วนใหญ่ยังคงเป็นตัวเลือกอันดับหนึ่งสำหรับบางโครงการ แต่สำหรับโครงการอื่นๆ ตัวเลือกนี้อาจมีราคาแพงในด้านต้นทุน พลังงาน และทรัพยากรการประมวลผล

Steven McMillan dent และซีอีโอของ Teradata ซึ่งเป็นผู้เสนอ ทางเลือก ให้กับธุรกิจบางแห่งก็มีมุมมองอื่นเช่นกัน เขามั่นใจว่าอนาคตอยู่ใน SLM

“เมื่อเรามองไปสู่อนาคต เราคิดว่าโมเดลภาษาขนาดเล็กและขนาดกลางและสภาพแวดล้อมที่มีการควบคุม เช่น LLM เฉพาะโดเมน จะให้โซลูชันที่ดีกว่ามาก”

~ แมคมิลแลน

SLM สร้างเอาต์พุตแบบกำหนดเอง สำหรับข้อมูลบางประเภท เนื่องจากโมเดลภาษาได้รับการฝึกฝนมาโดยเฉพาะเพื่อให้ทำเช่นนั้น เนื่องจากข้อมูลที่สร้างโดย SLM จะถูกเก็บไว้ภายใน โมเดลภาษาจึงได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่อาจละเอียดอ่อน

เนื่องจาก LLM ใช้พลังงานอย่างสิ้นเปลือง เวอร์ชันภาษาขนาดเล็กจึงได้รับการฝึกอบรมเพื่อปรับขนาดทั้งการประมวลผลและการใช้พลังงานให้ตรงกับความต้องการที่แท้จริงของโครงการ ด้วยการปรับเปลี่ยนดังกล่าว หมายความว่า SLM จะมีประสิทธิภาพด้วยต้นทุนที่ต่ำกว่ารุ่นขนาดใหญ่ในปัจจุบัน

สำหรับผู้ใช้ที่ต้องการใช้ AI เพื่อความรู้เฉพาะ มีตัวเลือกของ LLM เฉพาะโดเมน เนื่องจากไม่ได้ให้ความรู้ในวงกว้าง ได้รับการฝึกฝนให้เข้าใจข้อมูลเพียงประเภทเดียวอย่างลึกซึ้ง และตอบสนองได้แม่นยำมากขึ้น เช่น CMO กับ CFO ในโดเมนนั้น

เหตุใด SLM จึงเป็นตัวเลือกที่ต้องการ

ตามที่สมาคมนักวิทยาศาสตร์ข้อมูล (ADASci) พัฒนา SLM อย่างเต็มรูปแบบด้วยพารามิเตอร์ 7 พันล้านพารามิเตอร์สำหรับผู้ใช้หนึ่งล้านคน ต้องใช้พลังงานเพียง 55.1MWh (เมกะวัตต์ชั่วโมง)

ADaSci พบว่าการฝึกอบรม GPT-3 ด้วยพารามิเตอร์ 175 พันล้านพารามิเตอร์ใช้พลังงานไฟฟ้าประมาณ 1,287MWh และกำลังไฟฟ้าไม่รวมเมื่อเปิดให้สาธารณะใช้งานอย่างเป็นทางการ ดังนั้น SLM จึงใช้พลังงานประมาณ 5% ที่ใช้ไปผ่านการฝึกอบรม LLM

โมเดลขนาดใหญ่มักจะทำงานบนคอมพิวเตอร์ระบบคลาวด์เนื่องจากใช้พลังงานในการประมวลผลมากกว่าที่เคยมีในอุปกรณ์แต่ละเครื่อง สิ่งนี้ส่งผลให้เกิดความยุ่งยากสำหรับบริษัทต่างๆ เนื่องจากพวกเขาสูญเสียการควบคุมข้อมูลของตนในขณะที่ข้อมูลถูกย้ายไปยังระบบคลาวด์ และการตอบสนองที่ช้าในขณะที่พวกเขาเดินทางผ่านอินเทอร์เน็ต

ในอนาคต การนำ AI มาใช้โดยธุรกิจต่างๆ จะไม่ได้มีขนาดเดียวสำหรับทุกคนเนื่องจากประสิทธิภาพ และการเลือกเครื่องมือที่ดีที่สุดและราคาถูกที่สุดในการทำงานให้สำเร็จ ซึ่งหมายถึงการเลือกแบบจำลองขนาดที่เหมาะสมสำหรับแต่ละโครงการ

ซึ่งจะทำกับทุกรุ่น ไม่ว่าจะเป็น LLM สำหรับการใช้งานทั่วไป หรือ LLM ที่เล็กกว่าและเฉพาะโดเมน ขึ้นอยู่กับว่ารุ่นใดจะให้ผลลัพธ์ที่ดีกว่า ต้องการทรัพยากรน้อยลง และลดความจำเป็นในการย้ายข้อมูลไปยัง ระบบคลาวด์

ในระยะต่อไป AI จะมีความสำคัญต่อการตัดสินใจทางธุรกิจ เนื่องจากประชาชนมีความมั่นใจสูงในคำตอบที่สร้างโดย AI

“เมื่อคุณคิดถึงการฝึกโมเดล AI โมเดลเหล่านั้นจะต้องสร้างขึ้นบนพื้นฐานของข้อมูลที่ยอดเยี่ยม”

~ แมคมิลแลน

“นั่นคือสิ่งที่เราทุกคนเป็น โดยการจัดหาชุดข้อมูลที่เชื่อถือได้ จากนั้นมอบความสามารถและความสามารถในการวิเคราะห์ เพื่อให้ลูกค้าและลูกค้าของพวกเขาสามารถไว้วางใจผลลัพธ์ที่ได้” McMillan กล่าวเสริม

ด้วยประสิทธิภาพและความแม่นยำที่เป็นที่ต้องการสูงในโลก LLM ขนาดเล็กและเฉพาะโดเมนจึงเสนอทางเลือกอื่นในการมอบผลลัพธ์ที่บริษัทและสาธารณชนในวงกว้างสามารถไว้วางใจได้

จากศูนย์ถึง Web3 Pro: แผนเปิดตัวอาชีพ 90 วันของคุณ

ข้อจำกัดความรับผิดชอบ: ข้อมูลที่ให้ไว้บนเว็บไซต์นี้มีไว้เพื่อวัตถุประสงค์ทางการศึกษาและให้ข้อมูลเท่านั้น และไม่ควรถือเป็นคำแนะนำทางการเงินหรือการลงทุน

บทความที่เกี่ยวข้อง

ราคาทองคำและเงินฟื้นตัวอย่างแข็งแกร่ง: การฟื้นตัวในระยะสั้นหรือจุดเริ่มต้นของตลาดขาขึ้นรอบใหม่?

TradingKey - โลหะมีค่าดีดตัวกลับอย่างแข็งแกร่งหลังความผันผวนอย่างรุนแรง ในขณะที่ตลาดกำลังเผชิญกับการเลือกทิศทางที่สำคัญ หลังจากปรับตัวลดลงอย่างหนักติดต่อกันสองวัน ตลาดโลหะมีค่าได้กลับมาฟื้นตัวอย่างแข็งแกร่งในวันอังคารนี้ โดยเมื่อวันที่ 3 สัญญาซื้อขายทองคำและเงินล่วงหน้าในตลาดนิวยอร์กปิดตลาดพุ่งสูงขึ้นอย่างมีนัยสำคัญ ส่งผลให้บรรยากาศการลงทุนปรับตัวดีขึ้นอย่างเห็นได้ชัด นักลงทุนกำลังประเมินความตื่นตระหนกที่เกิดขึ้นก่อนหน้านี้จากปัจจัยทางนโยบายใหม่ และกำลังมองหาโอกาสในการเข้าซื้อเมื่อราคาอ่อนตัว (buy-the-dip) อย่างคึกคัก
TradingKey
วันพุธที่ 4 ก.พ.
cover

Bitcoin ETF กองทุนไหนดีที่สุด? และวิธีการซื้อ Bitcoin ETF

สนใจลงทุนใน Bitcoin แต่ยังกังวลเรื่องการจัดการกระเป๋าเงินดิจิทัลหรือไม่? คู่มือการลงทุน Bitcoin ETF ปี 2026 นำเสนอการเปรียบเทียบอัตราค่าธรรมเนียมการจัดการและมูลค่าหลักทรัพย์ตามราคาตลาดของ Spot ETF ชั้นนำอย่างครอบคลุม ซึ่งรวมถึง IBIT ของ BlackRock และ FBTC ของ Fidelity โดยคู่มือฉบับนี้จะวิเคราะห์ข้อดีและข้อเสียของการลงทุนผ่าน ETF เปรียบเทียบกับการถือครองสกุลเงินดิจิทัลโดยตรง พร้อมให้คำแนะนำขั้นตอนการซื้อผ่านแพลตฟอร์มต่าง ๆ เช่น Fidelity, IBKR และ Futu Bull เพื่อช่วยให้คุณเข้าสู่ตลาดคริปโตได้โดยง่ายและสามารถ "ช้อนซื้อ" (buy the dip) ได้อย่างมีประสิทธิภาพ
TradingKey
วันศุกร์ที่ 30 ม.ค.
cover

หุ้น UnitedHealth ทรุดตัวลงอีกครั้ง หลังเผชิญปัจจัยกดดันสองด้าน ยักษ์ใหญ่ธุรกิจประกันภัยจะหาทางฟื้นตัวได้จากที่ใด?

TradingKey - ศูนย์บริการเมดิแคร์และเมดิเคด (CMS) ของสหรัฐฯ ประกาศเมื่อวันจันทร์ว่า อัตราการจ่ายเงินสนับสนุนแผนประกันสุขภาพเมดิแคร์แอดแวนเทจ (Medicare Advantage) สำหรับปี 2027 จะปรับตัวเพิ่มขึ้นเพียง 0.09% ซึ่งต่ำกว่าระดับ 6% ที่นักวิเคราะห์คาดการณ์ไว้อย่างมาก ขณะเดียวกัน ยูไนเต็ดเฮลท์ (UnitedHealth) ระบุในรายงานแนวโน้มปี 2026 ว่าบริษัทมีแผนจะปรับลดจำนวนผู้ลงทะเบียนประกันสุขภาพลงมากกว่า 2 ล้านราย และคาดการณ์ว่ารายได้ในปีปัจจุบันจะลดลง 2% สู่ระดับ 4.39 แสนล้านดอลลาร์
TradingKey
วันพุธที่ 28 ม.ค.
cover
KeyAI