tradingkey.logo

小語言模型 (SLM) 被譽爲人工智能的下一個重大事件

Cryptopolitan2024年11月26日 05:17


雖然這些大型科技公司和其他公司正在投資數十億美元專注於開發大型法學碩士來處理許多不同的任務,但人工智能的現實是,沒有一種方法適合所有的情況,因爲企業需要特定於任務的模型。

AWS 首席執行官馬特·加曼 (Matt Garman) 在一份有關擴大合作伙伴關係和投資的新聞稿中表示,正在開發由 Anthropic 驅動的生成式 AI 的 AWS 客戶已經做出了壓倒性的反應。

對於大多數公司來說,法學碩士仍然是某些項目的第一選擇,但對於其他公司來說,這種選擇在成本、能源和計算資源方面可能會很昂貴。

Teradatadent兼首席執行官史蒂文·麥克米倫 (Steven McMillan) 爲一些企業提供了替代路徑,但他也有不同的看法。他對 SLM 充滿信心。

“展望未來,我們認爲中小型語言模型和受控環境(例如特定領域的法學碩士)將提供更好的解決方案。”

〜麥克米倫

SLM 針對特定類型的數據生成定製輸出,因爲語言模型經過專門訓練來實現這一點。由於 SLM 生成的數據保存在內部,因此語言模型會根據潛在的敏感數據進行訓練。

由於法學碩士非常消耗能源,因此小語言版本經過培訓,可以根據項目的實際需求調整計算和能源使用。通過這樣的調整,這意味着 SLM 比當前的大型模型更加高效且成本更低。

對於想要使用人工智能獲取特定知識的用戶來說,可以選擇特定領域的法學碩士,因爲它們不提供廣泛的知識。經過訓練,它只能深入瞭解一類信息並更準確地做出響應,例如該領域的 CMO 與 CFO。

爲什麼 SLM 是首選

據數據科學家協會 (ADaSci) 稱,爲 100 萬用戶完全開發具有 70 億個參數的 SLM 僅需要 55.1MWh(兆瓦時)。

ADaSci 發現,使用 1750 億個參數訓練GPT-3估計消耗了 1,287MWh 的電力,並且該電力不包括正式投入使用時的電力。因此,SLM 消耗的能量大約是 LLM 訓練消耗能量的 5%。

大型模型通常在雲計算機上運行,​​因爲它們使用的計算能力比單個設備上可用的計算能力更多。這會給公司帶來麻煩,因爲他們在信息轉移到雲端時失去了對信息的控制,並且在通過互聯網傳輸時反應緩慢。

展望未來,企業對人工智能的採用不會一刀切,因爲效率和選擇最好、最便宜的工具來完成任務將成爲焦點,這意味着爲每個項目選擇合適規模的模型。

這將爲所有模型完成,無論是通用的法學碩士,還是較小的特定領域的法學碩士,具體取決於哪個模型將提供更好的結果,需要更少的資源,並減少數據遷移到雲的需求。

在下一階段,人工智能對於商業決策至關重要,因爲公衆對人工智能生成的答案充滿信心。

“當你考慮訓練人工智能模型時,它們必須建立在大數據的基礎上。”

〜麥克米倫

“這就是我們的全部目的,提供可信的數據集,然後提供功能和分析功能,以便客戶及其客戶可以信任輸出,”麥克米蘭補充道。

隨着世界對效率和準確性的要求很高,規模較小且特定領域的法學碩士提供了另一種選擇,以提供公司和更廣泛的公衆可以信賴的結果。



審核Block Tao
免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。

相關文章

tradingkey.logo
tradingkey.logo
日內數據由路孚特(Refinitiv)提供,並受使用條款約束。歷史及當前收盤數據均由路孚特提供。所有報價均以當地交易所時間為準。美股報價的即時最後成交數據僅反映透過納斯達克報告的交易。日內數據延遲至少15分鐘或遵循交易所要求。
* 參考、分析和交易策略由提供商Trading Central提供,觀點基於分析師的獨立評估和判斷,未考慮投資者的投資目標和財務狀況。
風險提示:我們的網站和行動應用程式僅提供關於某些投資產品的一般資訊。Finsights 不提供財務建議或對任何投資產品的推薦,且提供此類資訊不應被解釋為 Finsights 提供財務建議或推薦。
投資產品存在重大投資風險,包括可能損失投資的本金,且可能並不適合所有人。投資產品的過去表現並不代表其未來表現。
Finsights 可能允許第三方廣告商或關聯公司在我們的網站或行動應用程式的任何部分放置或投放廣告,並可能根據您與廣告的互動情況獲得報酬。
© 版權所有: FINSIGHTS MEDIA PTE. LTD. 版權所有
KeyAI