玉林实硕医疗科技有限公司

每日簡訊:AI大戰升級!Meta推出先進大型語言模型 下一個ChatGPT不遠了?

ChatGPT的爆火引爆了AI行業,全球科技巨頭爭相殺入這一領域展開混戰。周五,Meta也宣布推出大型語言模型LLaMA,加入到由微軟、谷歌等科技巨頭主導的AI“軍備競賽”中。

當地時間2月24日,Meta宣布將推出針對研究社區的“Meta人工智能大型語言模型”系統(Large Language Model Meta AI),簡稱“LLaMA”。

同ChatGPT、New Bing不同,LLaMA并不是一個任何人都可以與之對話的產品,也并未接入任何Meta應用。更為確切地說,該產品將是一個開源的“研究工具”。


【資料圖】

公司CEO扎克伯格在社交媒體上表示,LLaMA旨在幫助研究人員推進研究工作,LLM(大型語言模型)在文本生成、問題回答、書面材料總結,以及自動證明數學定理、預測蛋白質結構等更復雜的方面也有很大的發展前景。

1、開源的“研究工具”

Meta表示,LLaMA可以在非商業許可下提供給政府、社區和學術界的研究人員和實體工作者,正在接受研究人員的申請。

此外,LLaMA將提供底層代碼供用戶使用,因此用戶可以自行調整模型,并將其用于與研究相關的用例。與之截然不同的是,谷歌旗下的DeepMind和OpenAI并不公開訓練代碼。

該公司還表示,LLaMA作為一個基礎模型被設計成多功能的,可以應用于許多不同的用例,而不是為特定任務設計的微調模型。

2、比GPT3.5性能更強

根據Meta官網介紹,LLaMA包含4個基礎模型,參數分別為70億、130億、330億和650億。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 萬億個 tokens 上訓練,而最小的模型 LLaMA 7B 也經過了 1 萬億個 tokens 的訓練。

Meta表示,在大多數基準測試中,參數小的多的LLaMA-13B的性能優于GPT3.5的前身GPT3-175B,而LLaMA-65B更可與業內最佳的Chinchilla-70B和PaLM-540B競爭。值得一提的是,近期大火的ChatGPT便是由GPT3.5提供支持。

Meta 還提及,LLaMA-13B對算力的要求“低得多”,可以在單個數據中心級GPU(Nvidia Tesla V100)上運行。

扎克伯格寫道:

“Meta 致力于這種開放的研究模式,我們將向 AI 研究社區提供我們的新模型。”

值得一提的是,去年5月,Meta 也曾推出過大型語言模型 OPT-175B。該項目同樣也是針對研究人員的,這構成了其聊天機器人 blenterbot 新迭代的基礎。后來,該公司還推出了一款名為“卡拉狄加”(Galactica) 的模型,但因經常分享偏見和不準確的信息而遭到下架。

據媒體報道,扎克伯格已將人工智能作為公司內部的首要任務,其本人也經常在財報電話會議和采訪中談論它對改進 Meta 產品的重要性。媒體分析稱,雖然現在 LLaMA 沒有在 Meta 產品中使用,但未來不排除使用的可能。

風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

關鍵詞: 語言模型 研究人員 人工智能