ng體育自媒體

-ng體育自媒體
首頁/網絡熱點/ 正文

Meta確認開源大模型LLaMA 3下月登場

admin2024-04-11網絡熱點4 ℃0 評論

  每經記者 文巧????每經編輯 蘭素英????

  在推出開源大模型LLaMA2近一年之后,Meta的新一代大模型LLaMA 3即將面世。

  在4月9日倫敦舉行的一次活動中,Meta確認計劃在下個月內首次發布LLaMA 3。據了解,該模型將有多個具有不同功能的版本。

Meta確認開源大模型LLaMA 3下月登場

  但Meta并沒有披露LLaMA 3的參數規模?!半S著時間的推移,我們的目標是讓由LLaMA驅動的Meta AI成為世界上最有用的助手?!盡eta人工智能研究副總裁Joelle Pineau說?!耙_到這個目標,還有相當多的工作要做?!?/p>

  而據科技外媒The Information4月8日發布的報道,作為對標GPT-4的大模型,LLaMA 3的大規模版本參數量可能超過1400億,而最大的LLaMA 2版本的參數量為700億。LLaMA 3將支持多模態處理,即同時理解和生成文本及圖片。

  值得注意的是,LLaMA 3將延續Meta一直以來的開源路線。目前,開源模型界的競爭正在變得愈發激烈,開源大模型亦進化得越來越強大。截至目前,包括谷歌、馬斯克旗下的xAI、Mistral AI、StabilityAI等在內的許多公司都發布了開源的大模型。

  作為開源模型界的“扛把子”,Meta在AI基礎設施上的投入亦不可小覷,目前只有微軟擁有與之相當的計算能力儲備。Meta發布的一篇技術博客稱,到2024年底,該公司將再購350000個英偉達H100 GPU,算上其他GPU,其算力相當于近600000個H100。

  LLaMA 3即將登場 參數量或達1400億

  在4月9日倫敦舉行的一次活動中,Meta確認計劃在下個月內首次發布LLaMA 3。Meta全球事務總裁Nick Clegg表示:“在下個月內,甚至是在很短的時間內,我們希望推出新的下一代基礎模型套件LLaMA 3?!?/p>

  從Nick Clegg的表述上看,LLaMA 3將有多個不同功能的版本?!敖衲陜?,我們將發布一系列具有不同功能、不同通用性的模型,很快就會開始發布?!?/p>

  同時,Meta首席產品官Chris Cox補充稱,Meta計劃用LLaMA 3為Meta的多個產品提供支持。

  值得注意的是,LLaMA 3將延續Meta一直以來的開源路線。

  與OpenAI堅持的閉源路線和大參數LLM不同,Meta從一開始就選擇了開源策略和小型化LLM。

  2023年2月,Meta在其官網公開發布了LLaMA大模型,與GPT系列模型類似,LLaMA也是一個建立在Transformer基礎架構上的自回歸語言模型。

  LLaMA包括70億、130億、330億、650億這四種參數規模,旨在推動LLM的小型化和平民化研究。相比之下,GPT-3最高則達到了1750億的參數規模。Meta在當時的論文中總結稱,盡管體積小了10倍以上,但LLaMA(130億參數)的性能優于GPT-3。

  一般來說,較小的模型成本更低,運行更快,且更容易微調。正如Meta首席執行官扎克伯格在此前的財報電話會議中稱,開源模型通常更安全、更高效,而且運行起來更具成本效益,它們不斷受到社區的審查和開發。

  談及開源問題,扎克伯格在接受外媒The Verge采訪時曾表示:“我傾向于認為,最大的挑戰之一是,如果你打造的東西真的很有價值,那么它最終會變得非常集中和狹隘。如果你讓它更加開放,那么就能解決機會和價值不平等可能帶來的大量問題。因此,這是整個開源愿景的重要組成部分?!?/p>

  除此之外,小型模型還便于開發者在移動設備上開發AI軟件,這也是LLaMA系列模型自開源以來就獲得開發者廣泛關注的原因。當前,Github上許多模型都是基于LLaMA系列模型而開發。

  去年7月,Meta發布了LLaMA 2。當時,Meta也采用了先發小模型的策略。在發布700億參數的LLaMA 2大規模版本之前,Meta先行推出了130億和70億參數的小型版本。

  不過,根據相關的測試,LLaMA 2拒絕回答一些爭議性較小的問題,例如如何對朋友惡作劇或怎樣“殺死”汽車發動機等。近幾個月來,Meta 一直在努力使LLaMA 3在回答有爭議的問題上更開放,也更準確。

  盡管Meta沒有透露LLaMA 3的參數規模,但從The Information的報道來看,作為對標GPT-4的大模型,LLaMA 3的大規模版本參數量據悉可能超過1400億,這與最大版本的LLa-MA 2相比提升了一倍。

  在整個開源模型界,競爭正在變得愈發激烈,開源大模型亦進化得越來越強大。

  今年2月,谷歌罕見地改變了去年堅持的大模型閉源策略,推出了開源大模型Gemma;3月,馬斯克也開源了旗下xAI公司的Grok- 1模型。根據Gemma和Grok-1的性能測試文檔,它們在數學、推理、代碼等多項基準測試方面的性能均超過了同規模的LLaMA 2模型。

  截至目前,包括谷歌、xAI、Mistral AI、DataBricks和StabilityAI等在內的多家科技公司發布了開源的大模型。有業內人士此前在接受《每日經濟新聞》記者采訪時說道:“開源是大勢所趨,我認為Meta正在引領這一趨勢,其次是Mistral AI、HuggingFace等規模較小的公司?!?/p>

  “狂卷”AGI 豪擲百億美元囤芯片

  作為開源模型界的“扛把子”,Meta在AI基礎設施上的投入亦不可小覷。

  實際上,Meta上個月曾發布一篇技術博客,展示了自己擁有的算力資源,以及布局AI基礎設施的細節和路線圖。該公司稱,其長期愿景是構建開放且負責任的通用人工智能(AGI),以便讓每個人都能廣泛使用并從中受益。

  Meta在博客中寫道:“到2024年底,我們的目標是繼續擴大(AI)基礎設施建設,其中包括350000個英偉達H100 GPU,這是其產品組合的一部分,算上其他,其算力相當于近600000個H100?!睋?,目前只有微軟擁有與之相當的計算能力儲備。按照亞馬遜給出的價格來算,一塊H100芯片大約3萬美元,350000個H100的價格就是105億美元(約合760億元人民幣)。

  在這份文檔中,Meta也透露了一些用于訓練LLaMA 3的集群細節,該集群由24576個英偉達H100 GPU構成。

  據市場跟蹤公司Omdia去年發布的一份報告,Meta和微軟是英偉達H100 GPU的最大買家。據其估算,上述兩家公司在2023年各自采購了150000個H100 GPU,是谷歌、亞馬遜、甲骨文等科技公司所購的H100 GPU數量的三倍以上。

  在前述文檔中,Meta也重申了將堅持一貫以來的開源路線,“Meta始終致力于人工智能軟件和硬件的開放創新。我們相信開源硬件和軟件將永遠是幫助行業大規模解決問題的寶貴工具?!?/p>

  值得一提的是,憑借AI上的投入,扎克伯格在福布斯最新發布的2024(第38屆)全球億萬富豪榜上居第四,資產凈值為1770億美元,這也是扎克伯格有記錄以來的最高排名。以美元計算,扎克伯格的資產凈值在過去一年增長最多,共增加1126億美元,增幅為174.8%。

額 本文暫時沒人評論 來添加一個吧

發表評論

97超碰亚洲中文字幕一区-亚洲国产一区二区三区中文字幕-国产色在线?|?日韩-久久精品国产999久久久