《科創板日報》1月21日訊(編輯 宋子喬)?OpenAI的GPT系列身后,國產大模型正緊追不舍。
1月20日,DeepSeek正式發布DeepSeek-R1,并同步開源模型權重。據介紹,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
根據其公布的測試數據,DeepSeek-R1在美國AIME 2024、MATH-500和SWE-bench Verified測試中的比分均高于OpenAI o1(小K注:前兩個測試專注于數學能力,SWE-bench Verified旨在評估AI模型解決現實世界軟件問題的能力)。
同一天,Kimi全新SOTA模型——k1.5多模態思考模型上線。在long-CoT模式下,Kimi k1.5的數學、代碼、多模態推理能力,也達到長思考SOTA模型OpenAI o1正式版的水平。官方表示,這應該是全球范圍內,OpenAI之外的公司首次實現o1正式版的多模態推理性能。Kimi技術團隊第一次準備了詳細的技術報告。
在short-CoT模式下,Kimi k1.5的數學、代碼、視覺多模態和通用能力,大幅超越了全球范圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領先達到550%。
其他國產大模型同樣表現出色,1月15日,MiniMax發布全新開源模型系列Minimax-01,在多個標準和內部基準測試中,Minimax-01的性能與GPT-4o、Claude3.5-Sonnet等頂尖模型相當,尤其在長上下文處理方面表現突出。
OpenAI分別在2024年5月、9月和12月發布了GPT-4o、GPT-o1(包括o1-preview和o1-mini,o1正式版推遲到2024年12月發布)和GPT-o3,目前最強大的模型是o3,具備出色的推理能力、科學知識掌握更優秀、編碼能力更強。
o1緊隨其后,擅長編碼、數學和寫作,其多模態功能支持圖片上傳,允許它將推理應用于視覺,以獲得更詳細、更有用的回復。
以DeepSeek為代表的國產大模型團隊力圖在性能上比肩最先進的大模型,定價則展示了極致性價比。
DeepSeek-R1 API服務定價為每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中);每百萬輸出tokens 16元。
與之對比,GPT-o1模型每百萬輸入tokens 15美元(約合人民幣110元);每百萬輸出tokens 60美元(約合人民幣438元)。OpenAI目前最便宜的模型是GPT-4o mini,其定價為每百萬輸入Tokens 10美元(約合人民幣73元);每百萬輸出tokens 20美元(約合人民幣146元)。
國產大模型呼喚國產算力
國內外大模型廠商你追我趕,短時間內迅速迭代,意味著大模型廠商對算力的需求仍在繼續增加。
火山引擎智能算法負責人吳迪此前曾表示,字節跳動綜合考慮算力資源儲備、市場未來用量、模型成本下降等因素判斷,2027年豆包每天Token消耗量會超過100萬億,將是現在的100倍以上。
1月20日消息稱,據蕪湖市生態環境局官網,字節跳動(抖音集團)旗下蕪湖江東名邑科技有限公司擬在安徽蕪湖建設火山引擎長三角算力中心項目,項目環境影響評價文件近日獲受理,并正在實施批前公示。該項目總投資80億元,設計服務器機柜數為21824臺,網絡機柜236臺,一座220kV變電站。
此前有消息稱,小米正在搭建自己的GPU萬卡集群,并對AI大模型進行大規模投資。
東莞證券此前表示,未來,隨著字節、幻方、小米等國內廠商積極布局AI領域,國產大模型有望快速崛起,推動國產算力需求增長,促進國產算力基礎設施建設,我國國產算力產業鏈有望迎來發展機遇。
上海證券也發布研報稱,以字節為代表的國產大模型崛起,以及小米等玩家的入局,有望拉動國內互聯網大廠在算力端的支出,國內算力軍備競賽剛剛開始,國產算力廠商迎來發展機遇。
東方證券表示,算力建設持續性至關重要,在此背景下,服務器及液冷廠商、PCB廠商等有望受益。此外,數據存力和運力需求的持續攀升,為存儲、光模塊和光芯片等企業創造了更多的市場機會,促使整個產業鏈不斷優化升級,以滿足日益增長的AI算力需求。