摘要:大模型賽道,是時候換個卷法了
撰文?| 吳先之? 文燁豪
編輯?| 王? ?潘
國內大模型戰事,一度被諸多疑云所籠罩。而隨著京東、騰訊接連入座,這場復雜的牌局正變得明晰起來。
百度與阿里,作為國內最早一批大模型玩家,在“先聲奪人”的同時亦爭得了早期的流量。相比之下,騰訊、京東雖起步稍晚,但其更能深入審視大模型賽道,以加深對行業的理解。
正因如此,一些發布大模型相對較晚的大廠并未盲從大眾,投入通用大模型的大潮。例如此前華為大模型提到實用性,而京東憑借著自身在產業、供應鏈等方面積累的深厚積累,選擇了一條更有遠見且更具針對性的路徑,并在2023京東全球科技探索者大會暨京東云峰會(JDD大會),推出面向產業的京東言犀大模型。
在通用大模型混戰的當下,京東推出的言犀大模型和其產業價值創造路徑,既是建立大模型商業秩序的絕佳嘗試,亦為整個行業帶來全新的思考和方向。在大模型的商業化滯水里,距離落地更近的產業大模型,極可能在未來的大模型競逐中一路領跑,成為一股不可忽視的新生力量。
大模型,既不是“故事”也不是“玩具”
每一輪科技演替的浪潮,往往也裹挾著大量的泥沙。
從早年的芯片、機器人,再到AI,每一波浪潮里,總有一些別有用心的玩家混跡于其中,將科技與營銷混淆在一起,使原本清澈的賽道愈發渾濁。現階段的國內大模型賽道,亦是如此。
賽道的一側,玩家們苦苦摸索著大模型的技術脈絡,并試圖找尋落地方向;而在另一側,縱使是和科技領域八竿子打不著一塊的公司,也在紛紛下場,訓練出所謂的“大模型”產品——不得不承認,當下“萬物皆可大模型”的局面,頗有兩年前“萬物皆可元宇宙”的意味。
顯然,當所謂的“大模型”變成一個代名詞,服務于自身“講故事”的訴求,而非創造實際價值,那大概率只能奔赴元宇宙的宿命。而這,對那些老實鉆研技術的玩家們而言,同樣成立。畢竟技術本身很難直接創造價值——大模型的終點,并非訓練出通用大模型本身,而是讓技術產生價值,進而實現成熟的商業化落地。
因此,追風蹭熱者們看似滑稽的操作,其實給大模型賽道敲響了一記警鐘。畢竟點燃AIGC的ChatGPT,潛移默化地影響著玩家們的大模型觀,使一眾玩家紛紛奔赴通用大模型,推出多款ChatGPT的“變種”。
客觀地說,通用大模型有其價值所在,但在競爭維度愈發劇烈的當下,通用大模型并非坦途:
一方面,玩家們紛紛涌向單一領域,極有可能陷入“重復制造輪子”的境遇,想要從充斥著國內外科技巨頭的戰場中突圍,難度可想而知。
另一方面,通用大模型是典型的消費與付費分離的產物,稍有不慎便會淪為“玩具”。
舉一個簡單的例子,廣泛的C端用戶或許會向其咨詢問題乃至探討宇宙和天空,但絕大部分普通用戶其實并沒有生產力訴求,在短期密集體驗后,對新興科技的新鮮感便會迅速喪失,未必有長期使用的動力。
基于此,縱使當下的通用大模型能在一定程度上提升內容創作效率,除了部分內容行業與組織內部降本增效以外,其尚未跑出成熟、可復制的商業模式。可以預見,隨著通用大模型賽道日益擁擠,玩家們勢必將在商業化延展層面面臨諸多考驗。
歸根結底,“奇點”已至的當下,大模型不僅是科技演替的里程碑,更是塑造未來的關鍵驅動力。因循該邏輯,現階段大模型戰事絕非一場短程競速,而是一項系統性工程。玩家們若想穿越周期、熬到終點,不能只靠技術層面的單點突破,而是需要同步思考技術方向、場景應用、商業模式等諸多維度。
產業大模型,“百模大戰”的新戰線
從1997年,“深藍”戰勝象棋大師加里·卡斯帕羅夫,到“阿爾法狗”殺入圍棋圈,再到視覺系AI與自動駕駛,AI過往經歷了多輪振奮人心的演化,每一輪仿佛都站在應用爆發的邊緣,可滿枝的花骨朵,卻又遲遲未能開出繁花。
這背后的主因在于,技術尚未在產業端形成深厚的應用,畢竟科技進步的終點,不是在困在實驗室里,而是落地下潛,走向“現實世界”。
因循該邏輯,審視現如今的通用大模型賽道,距離在真實商業場景落地生根并創造出實際價值,仍有著不少距離。
京東集團CEO許冉在JDD大會現場表示,大模型本身是實現產業價值的工具,而不是目的,大模型真正實現自己的價值,一定是在產業應用中。
換言之,大模型不是目的,應用才是目的。
當下的大模型廠商,往往會將模型參數視為大模型好壞的檢驗標準。殊不知,在商業落地層面,巨大的參數亦對應著高企的成本,亦存在著相應時間長、并發性差等問題。
一個簡單的例子,部分“參數怪獸”,每回答一個問題就要耗費兩三毛錢,還需等待5-10秒,就算回答得再精準,也很難實現大規模的商業化落地。此外,目前通用大模型85%左右的準確率,對于普通用戶而言或許已經足夠,但在嚴肅的商業場景下,此番誤差很有可能對業務產生難以忽視的影響。
針對應用問題,京東多條業務線技術負責人都提到,人們會因為GPT一個編造的回答付之一笑,可一旦落實到實際應用過程中,任何偏差都導致巨大損失。
京東探索研究院院長、京東科技智能服務和產品部總裁何曉冬博士曾親身經歷過一件事情,頗有代表性。“一個大模型回答143開平方,給出的答案是11.5(實際上約等于11.96),如果在實際應用場景中,這個答案將會帶來巨大損失。”
在技術領域,模型參數、精度固然重要,但在商業世界中,大模型本身好用且穩定才是關鍵。而在此方面,同細分產業緊密關聯的產業大模型,無疑存在著天然的優勢。
只是,研發產業大模型絕非易事。眾所周知,訓練數據是大模型學習的基礎,亦決定了大模型的泛化能力與應用場景。因此,除了技術層面的突破,源于產業的一手場景、數據,對研發產業大模型而言同樣重要。
以京東為例,其之所以會推出面向產業的言犀大模型,很大程度上便源于其濃厚的產業基因。畢竟在一眾國內大廠中,鏈接著消費市場與供應鏈兩端的京東,同產業的綁定甚強,亦具備大量優質數據。
據悉,言犀大模型訓練時,便融合70%的通用數據與30%數智供應鏈原生數據。可見,京東并不純粹強調參數,也非刻意講述“故事”,而是將重點放在“調教”層面,旨在打造出同產業高度相融的大模型。
產業大模型,或將成為大模型賽道邁向大規模商業化的重要一步,而逐漸參透該邏輯的玩家們,亦在漸漸上車。
近日,遲遲按兵不動的騰訊,發布了自己的行業大模型;高舉通用大模型大旗的百度,亦端出覆蓋交通、能源等領域的行業大模型。不難看出,隨著巨頭們紛紛加碼,更貼近商業化的產業大模型,已然成為了“百模大戰”的新戰線。
狹路相逢,得“場景”者勝
無論是通用大模型,還是產業大模型,構筑出新的商業秩序始終繞不開“場景”。
換言之,對于落地而言,晦澀的技術名詞、炫目的商業PPT均是空中樓閣,只有將大模型能力真正運用到場景中,并產生實際價值,才能打通良性循環。
而在各行各業AIGC需求井噴的當下,為大模型找到所謂的應用場景,本身并不算難。可若想找到適合大模型大規模落地,并跑通商業化路徑的場景,則可能要經歷大量的彎路。
因循該邏輯,已然端出大模型的玩家們,正在各種細分領域不斷嘗試,試圖尋找屬于自身的落腳點:
百度抓住一年一度的高考熱點,推出AI志愿助手,活用大模型能力的同時,亦試圖借此打入C端市場;阿里則以天貓精靈為錨點,探索大模型在消費電子領域的發展空間。
發力產業大模型的京東,則提出了“大模型的價值=算法×算力×數據×產業厚度的平方”的公式,而所謂的“產業厚度”,正是由一個個具體的場景堆砌而成。
無論路徑如何,大模型玩家們抵達“應許之地”之前,勢必將不斷試錯,乃至穿越“紅海”。
面對大模型的落地難題,部分玩家選擇扮演“賣水人”的角色,幫助企業構建屬于自己的大模型。而打法一向務實的京東,則提出了“三步走”戰略,即先搭建通用大模型,然后在內部探索場景與應用,而后逐步將能力對外開放——將自身作為試驗田的同時,亦自我消化掉試錯成本,以確保大模型產品能創造實際價值。
據悉,在京東內部,大模型不僅已經嵌入了數智營銷、運營流程優化、客戶服務等常見應用場景,更已延伸至零售、物流、金融、健康等諸多垂直場景。
以物流領域為例,面對這一門繁雜的系統工程,京東跑出了多條探索路徑:歷時5年打造的供應鏈產品京慧,除了豐富的AI預測、運籌優化等原生算法外,通過開放生態技術,不僅能很好的與異構系統的算法及數據互聯互通,在大模型的加持下,在銷量預測、庫存、供應及補貨計劃方面更具表現力,同時由于AIGC的廣泛應用,其交互式供應鏈控制塔能夠幫助用戶快速定位并解決供應鏈問題。
在基金理財場景,京東金融“智能選基”產品上線。傳統的基金篩選,理解成本高,操作繁鎖,直接影響交易成功率。借助大模型,京東在意圖匹配、算法生成、意圖識別、多輪對話等環節進行優化,使常見篩選問題準確率達90%,有效提升客戶體驗和交易效率。這一產品后續也將全面服務于金融機構。
由此可見,京東的“三步走”戰略已初見成效,并已逐漸浸潤到物流、金融等垂直行業的肌理之中。可以預見,隨著戰略逐漸鋪開,京東亦將不斷積累落地場景、高質量數據,從而轉動起產業大模型商業落地的飛輪。
歸根結底,看似復雜的大模型戰事,終究要回歸一個核心問題,即技術如何為實體產業帶來實際價值。而現階段,道路不同的玩家們,只能在這場漫長的馬拉松,逐漸摸索、實踐出問題的答案。