新浪科技報道,北京時間2月18日12點30分左右,馬斯克與xAI團隊的另外三位技術負責人,一同發布了公司最新推出的Grok-3基座大模型。
短短30分鐘的發布過程中,馬斯克及其團隊向大家介紹了Grok-3比DeepSeek-V3、OpenAI-4o等更爲突出的數學、科學推理性能,演示了大模型代碼創作能力,同時也公布了後續的开源計劃。
強大的模型性能背後,Grok-3的訓練成本也成了備受關注的一個焦點。
據馬斯克在直播中披露,Grok 3在訓練過程累計消耗了20萬塊英偉達GPU,訓練在xAI公司的數據中心完成。有馬斯克團隊人員介紹稱,“我們花了122天才完成了第一個10萬卡訓練,但我們並沒有就此止步,如果我們想要構建巨型人工智能,需要立即將集群的大小增加一倍。”
相較於DeepSeek以遠低於同行“1/20的成本”訓練出比肩OpenAI-01模型能力的R1模型,Grok-3的這一算力消耗屬實不小。就在馬斯克公布Grok-3訓練成本後,很快便有人員分析指出,“Grok-3的算力消耗是DeepSeek-v3的263倍,中國的模型團隊只得望洋興嘆。”
當全球範圍內越來越多的企業都开始選擇使用更加低成本的AI大模型時,昔日的AI大模型機構們,也不得不放低姿態,开始擁抱市場。對於Grok-3而言,高昂的訓練成本及不开源的策略,或許將成爲阻礙其普及的一大關鍵。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:分析稱Grok3成本是DeepSeek的263倍 消耗了20萬塊英偉達GPU
地址:https://www.newsipad.com/article/188620.html