導語:應用的進步,可以推動基礎模型的創新
文?|?陳世鋒
2024年5月22日,第八屆VivaTech在法國巴黎凡爾賽門展覽中心隆重舉行。會議期間,來自全球各地的參會者們認真傾聽數百個獨一無二的創意,不斷激發科技改變世界的夢想,氣氛非常熱烈。
VivaTech全稱Viva Technology,是歐洲最大科技創新盛會,堪稱歐洲AI春晚。歷屆大會中,法國總統均到場出席,谷歌、微軟、IBM、三星、特斯拉等各個科技巨頭的董事長和CEO也是大會常客。
作為世界領先的科技和創新展覽之一,2023年第七屆VivaTech大會吸引了來自174個國家的15萬名參觀者、1.14萬家初創企業和2800家參展商,同時還有40.5萬人通過網絡在線觀展,9億多社交媒體用戶關注。
目前正在召開的第八屆VivaTech大會,有超2500家初創企業和2000名國際投資者,25個行業和350多家公司和組織參與,全球多個明星公司和頂級嘉賓出席,包括特斯拉CEO馬斯克、圖靈獎得主Yoshua Bengio、Meta首席科學家Yann LeCun、Anthropic首席執行官Dario Amodei、法國AI獨角獸Mistral AI CEO Arthur Mensch、Salesforce AI CEO Marc Benioff等一眾AI大佬,法國總統馬克龍也應邀參會。
值得關注的是,中國展區將作為本屆VivaTech亮點之一重磅回歸,百度創始人、董事長兼首席執行官李彥宏作為大會唯一受邀發言的中國AI領袖,在主論壇“爐邊談話”與VivaTech聯合總裁展開對話。VivaTech大會的推文中,將李彥宏稱為“長期的AI支持者”和“中國AI的頭號玩家”。
“很多人都在關注GPT-5的發布時間,但我更感興趣的是,哪些應用可以充分利用大語言模型的所有能力。”李彥宏在與陽獅集團監事會主席莫里斯?列維(Maurice Levy)對談時表示,中國AI與西方的最大區別在于應用,中國有數百個基礎模型,但人們越來越多地在討論什么是AI時代的超級應用。他介紹說,應用驅動了中國AI的快速發展。
在李彥宏看來,關注應用并非是忽視基礎模型的發展,與之相反,AI應用與基礎大模型的發展相輔相成。應用的進步,可以推動基礎模型的創新,也有助于加快從互聯網時代向人工智能時代的轉變。
“我是人工智能的長期信仰者。所以在十多年前,我們就開始積極投入研發人工智能,尤其是與自然語言相關的人工智能。”李彥宏表示。
01
中國AI的頭號玩家
一直以來,李彥宏信仰技術,他曾在公開發言中表示,“技術是我們的信仰,百度走到今天,是因為我們信仰技術,我們覺得技術可以改變世界。”早在30年前,李彥宏在北大讀書期間就對AI抱有濃厚的興趣。李彥宏創立百度后,在確立了中文搜索引擎的絕對優勢后,他意識到AI是解決搜索引擎問題的核心技術,因為兩者的本質,都是讓機器理解人類語言。“所以在十多年前,我們就開始積極投入研發人工智能,尤其是與自然語言相關的人工智能。”
2023年,《時代》周刊發布了首屆全球百大AI人物,李彥宏與特斯拉CEO埃隆·馬斯克、英偉達創始人兼CEO黃仁勛、Open AI CEO薩姆·奧特曼等人被評為全球AI領袖,是該榜單中唯一入選的中國企業家。《時代》周刊在介紹李彥宏時表示,“李彥宏是中國最杰出的未來主義者,長期投身于AI發展的浪潮。”(As China’s foremost futurist, Robin Li has been riding the AI wave for a long time.)
李彥宏對AI抱有極大的熱情。在2024年的一次內部講話中,李彥宏表示,“大模型我們走在最前面,我們要去勇闖無人區,需要去冒前人沒有冒過的風險。”……“十個創新,可能九個最后都是以失敗告終的,但我們不會放棄,我們會去做第11個、第12個……我相信終有一天,我們會向世界證明,技術是有價值的。”
經過十多年的布局,百度在AI研發方面投入近1700億元,創造了一系列突出的技術成果,持續引領中國AI浪潮。李彥宏介紹說,百度于2019年推出1億參數規模的文心大模型1.0版本,在2.0版本升級至10億參數,ChatGPT發布后不久,即推出了3.0版本,發布速度遠超全球其他上市公司,“是因為我們準備得更加充足、工程師非常努力,我們一直在朝著這個方向努力。”
在AI原生應用方面,百度在全球科技大廠中首個推出中文大語言模型應用——文心一言。文心一言開放首日即回答了用戶3342萬個問題。開放后12小時,文心一言迅速登上Apple Store免費應用排行榜首位,成為首個登頂應用商店榜首的中文AI原生應用。
在文心一言的幫助下,廣大用戶“解放了生產力”。某昵稱為“1952的野生”知乎博主表示,文心一言激發了他的創作想法,可以快速潤色內容。“我覺得文心一言對我的幫助主要體現在兩個方面,一個方面是解放,另外一個方面是自信。”
文心一言也創造了新的“工作崗位”。一位18歲的實習提示詞工程師Mio,在短短兩個月內瘋狂寫提示詞,成功上線了100多個,順利成為AI行業的從業者之一。他認為,“文心一言可以說是直接改變了我的生活方式。原來我只是一個愛好者,靠著文心一言我現在竟然成為了一個從業者,這是我一年前不敢想的。”
近期,新東方英語名師、孟羽童等知名人物也先后入駐文心一言APP。根據李彥宏在2024百度AI開發者大會上披露的數據,發布一年多以來,文心一言用戶已經突破2億。與2023年12月相比,其用戶規模足足翻了一倍。
百度還在2013年就已經開始布局自動駕駛。李彥宏在2024百度AI開發者大會上透露,“視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是最好的,是自動駕駛的全球領導者,我們不只訓練AI如何生成視頻,更訓練AI理解真實世界發生的事情并預測未來。”
2017年,百度對外開放了國內第一個自動駕駛平臺Apollo(阿波羅)。根據全球領先的法律和商業分析商“律商聯訊LexisNexis”最新發布的《駛向未來:自動駕駛創新洞察》(Driving Toward Tomorrow:A Deep Dive Into Autonomous Vehicle Innovation)報告,百度自動駕駛在專利資產指數、專利包規模等多項排名上位列全球榜首,展現了創新技術與商業化的成功結合。
公開資料顯示,百度Apollo L4級自動駕駛安全運營測試里程累計已超1億公里,自動駕駛牌照數量超過1000張,已經成為智能化汽車時代的“賣水人”。
此外,百度還力圖成為AI領域的“黃埔軍校”。2020年6月,百度宣布未來5年預計培養AI人才500萬,到2024年4月,百度宣布該計劃已經提前完成。但百度還在持續發力AI人才培養,2023百度世界大會上,百度又公布了人才培養星河計劃,將為社會再培養500萬大模型人才。
一直以來,百度都在不斷提升大模型的效率和效果,降低大模型的成本和門檻,讓更多人享受到AI的時代紅利。2024年5月21日,百度甚至宣布將ERNIE Speed、ERNIE Lite兩款大模型免費。
由于其在AI領域的突出貢獻,2023年11月21日《財富》發布的首屆全球“《財富》人工智能創新者50強榜單”(Fortune 50 AI Innovators)中,百度成為唯一入選該榜單的中國企業,同時入選50強的還有微軟、谷歌、OpenAI等全球知名科技企業。
《財富》在對百度的評語中指出,百度文心大模型4.0在成熟度和功能上與OpenAI的ChatGPT不相上下,并在多項中文特定任務中超越了ChatGPT。
經過十年的磨礪,百度AI逐漸展露鋒芒。正如李彥宏所說,“人們總是高估技術的短期價值,低估技術的長期價值,”……“堅定的信仰和持久的堅持,讓我們實現顛覆性創新”。他還表示,“2023年已經看到了通向通用人工智能的曙光,2024年我們熬過去,就能夠化繭成蝶。”
02
AI應用驅動基礎模型創新
AI大模型能夠理解人類的自然語言表達,并通過龐大的網絡結構實現具有針對性的內容輸出。從效果上看,生成式AI表現為“無所不知、無所不能”,其具備了邏輯推理、上下文理解、文字創作、知識提取、代碼生成等非常多元化的強大能力,但這取決于大模型的訓練程度。
一位業內人士表示,“通過中文或英文數據訓練出來的大模型,差異還是比較大的,中文的上下文理解和語義的多解性要大于英文。”因而,以中文“投喂”大模型的中國科技大廠在這個方面具有天然優勢。
在目前全球各類大模型評測榜單中,國內大模型均在TOP10中長期占據半數席位,其中百度文心大模型、阿里通義千問、智譜GLM-4等更是穩居TOP5,在理解、邏輯、記憶等整體能力上保持在世界一流水平,更在中文理解與創作上具有顯著優勢。
值得一提的是,得益于百度四層技術棧的獨特優勢,芯片、框架、大模型和終端應用場景能夠形成高效的反饋閉環,能夠幫助大模型不斷調優迭代。相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。
根據2024年3月國內人工智能權威機構清華大學基礎模型研究中心發布《SuperBench大模型綜合能力評測報告》,在人類對齊能力評測中的中文推理和中文語言,以及語義理解中的數學能力和閱讀理解能力等方面,文心大模型具有明顯優勢。李彥宏在大會上也表示,“現在文心大模型4.0比中文的GPT 4更好,因為我們使用了更多的中文數據來訓練模型。”
此外,中國有著豐富的AI應用場景。正如李彥宏在大會上所說,“中國AI與西方的最大區別在于應用,中國有數百個基礎模型,但人們越來越多地在討論什么是AI時代的超級應用。”他抱有這樣一種觀點——技術的進步或改進是由應用場景驅動的。“應用領域的進步可以推動基礎模型的創新,也有助于加速從互聯網時代到人工智能時代的轉變。”
在李彥宏看來,沒有構建于基礎模型之上的、豐富的AI原生應用生態,大模型一文不值。“如果說大模型是‘樹根’,那么大量優質的應用則是大模型壯碩‘樹根’所結出的累累碩果。”
過去幾年,中國依靠多樣化的應用場景以及超大規模市場優勢,在社交、移動支付、搜索、電商、外賣、快遞等領域孵化一批領先的優質應用,并在產業化的縱深和廣度上日益精進。隨著AI大模型的接入,將會為產業變革帶來更大圖景和潛在價值。
李彥宏對此深信不移,他在2024年百度Q1業績電話會上表示,“隨著生成式人工智能時代在中國的到來,文心大模型等基礎模型將成為基礎設施,融入人們生活的方方面面。我們正在讓文心大模型系列變得更加實惠和高效。這將為百度帶來更多機遇。”
百度正在“積極推進用文心大模型重構To C和To B業務,利用生成式AI增強用戶體驗、提升客戶效率、提供智能體和應用開發工具、并帶來更高效的系列模型。”
To C業務方面,百度已經與三星、榮耀、小米、OPPO、vivo等手機廠商達成合作。比如在三星全新推出的Galaxy S24手機中,深度集成了百度文心大模型的多項能力,不僅可提供端側賦能的通話、翻譯功能,還給用戶帶來全新的智能摘要、排版等生成AI體驗,首創的“即圈即搜”功能更令人驚艷。
而“文心大模型”與榮耀平臺級端側AI大模型“魔法大模型”相結合則滿足了用戶的更多個性化需求。比如,當用戶要求“幫我制定健康計劃”時,魔法大模型會分析用戶健康信息,自動生成具象化提示詞,再調度文心大模型,生成更全面的個人定制健身計劃。
如今,文心大模型的合作領域還從手機向PC和電動汽車領域拓展,合作對象包括聯想、蔚來汽車等頭部品牌。李彥宏表示,向智能設備的拓展,為文心大模型被更大規模用戶采用提供了充足機會。
B端,百度充分發揮技術優勢,全面升級百度智能云千帆大模型平臺,發布系列新模型及開發工具組件,滿足企業在大模型產業場景落地中的多樣化需求,并已經成功應用在金融、能源、教育等多個產業中。
比如在礦山產業,百度智能云攜手山源科技,基于文心大模型,依托百度智能云千帆大模型平臺能力共同打造了礦山行業智能應用“電博士及數字調度員”,通過注入供電專業相關知識、經驗、規則、規范等,讓大模型具備煤礦供電的專業知識和技能,定位于煤礦供電專業的資深貼身助手,實現陪伴式輔助運維。
AI大模型是一個重資源稟賦、高進入門檻的賽道,除了對算法模型的有效性、高質量的數據、算力的支撐能力均有極高要求外,模型的優化迭代亦有賴于資金和人才的持續投入,而大模型的實際落地和應用場景也是其能否持續升級的重要因素。
李彥宏堅信:“在未來五年,或者十年,每個國家都有機會發展自己的AI大模型。我確信生成式人工智能具有真正變個性的力量,它最終會像人類一樣聰明,而且進步得很快。當我們朝著這個方向努力的時候,每個人的生活都會得到改善。”