摘要:①據稱,其最新大模型性能比肩GPT-4,價格僅有GPT-4的近百分之一。 ②機構計算,在算力服務力利用率最高的情況下,DeepSeek每臺服務器每小時收益可達35.4美元,毛利率在70%以上。 ③此前該量化私募已手握超萬張英偉達GPU,更為了發展人工智能租下近2000平方米場地。
《科創板日報》5月10日訊?連AI大模型也開始“卷”價格了,這次舉起“砍價屠刀”的攪局者,沒有科技巨頭加持,也沒有互聯網大廠背景,而是和幻方這家量化私募有著千絲萬縷關系。
日前,深度求索開源第二代MoE大模型DeepSeek-V2,頂著“價格屠夫”的稱號一炮而紅——性能比肩GPT-4、價格僅有GPT-4的近百分之一。
值得注意的是,DeepSeek出品公司是杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“杭州深度求索”),此前多家媒體報道顯示,深度求索為幻方旗下組織機構。且幻方量化曾在去年4月發布公告稱,將全力投身到人工智能技術之中,成立新的獨立研究組織“深度求索”。
另據天眼查數據顯示,杭州深度求索的背后為幻方量化實控人梁文鋒,后者在杭州深度求索最終受益的股份比例超八成。
性能方面,DeepSeek-V2擁有2360億參數,其中每個token210億個活躍參數。據官網介紹,DeepSeek-V2中文綜合能力(AlignBench)“在眾多開源模型中最強”,超過GPT-4,與GPT-4-Turbo,文心 4.0等閉源模型在評測中處于同一梯隊;英文綜合能力(MT-Bench)與LLaMA3-70B處于同一梯隊,超過最強MoE開源模型Mixtral8x22B。
算力需求方面,分析機構SemiAnalysis指出,DeepSeek-V2訓練參數量達8.1萬億個token,而表現出“難以置信”的訓練效率,計算量僅為Meta Llama 3 70B的1/5,更只有GPT-4 的1/20。
如果說上述這些只是AI技術迭代浪潮中常見的“技術炫技”,那么價格則是該模型最引發關注的要點。
目前DeepSeek-V2 API定價為:每百萬token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。
SemiAnalysis給出了“便宜得難以置信”的評價。據該機構計算,在其算力服務力利用率最高的情況下,DeepSeek每臺服務器每小時收益可達35.4美元,毛利率在70%以上。
幻方量化,這家號稱量化界“四大天王”之一的私募,管理規模曾一度飆升至千億,但之后幻方產品大幅回撤,管理規模也迅速縮水。去年年末,幻方還遭投資者控訴稱,“花100萬元買了幻方量化的產品兩年多,贖回時只剩約80萬元,還要被計提3萬多的業績報酬”。
幻方量化去年4月公告成立“深度求索(DeepSeek)”之后,深度求索發布了第一代大模型,并將免費商用,完全開源。
彼時,幻方量化的公告曾在業內引發“AI炒股說”的議論,但幻方量化董事總經理陸政哲表示,“我用中文重申一下:AGI不是用來炒股的,有大得多的用處和大得多的價值。”
在此之前,幻方量化已于2019年投資2億元自主研發深度學習訓練平臺“螢火一號”,搭載了1100塊GPU;2021年幻方量化對“螢火二號”投入增加到10億元,且搭載了約1萬張英偉達A100顯卡——也是在那一年末,OpenAI的ChatGPT橫空出世,掀起全球AI熱潮和英偉達GPU“搶購潮”。
值得一提的是,為了投入人工智能,幻方還租下“20個網球場”。去年末有媒體報道稱,北京深度求索人工智能(以下簡稱“北京深度求索”)正在進行裝修招標,辦公室選址于北京海淀區融科中心,裝修工程面積達1950平方米,并獲得了施工許可證。
而天眼查顯示,北京深度求索則由上文提到的杭州深度求索100%控股。