如果要給中國大模型的創(chuàng)業(yè)圖譜尋找一個坐標系,清華大學東門外的幾棟樓或許是最好的選擇。
幾個十字路口,隔著幾層樓,矗立著的樓宇里聚集著中國大模型行業(yè)的先行者。最矚目的要數(shù)搜狐網(wǎng)絡大廈,它位于園區(qū)的東南角,二層是王小川的百川智能,七層到十一層是來自清華知識工程研究室(KEG)的智譜AI。距離這里不遠的地方,是聆心智能、深言科技與瀾舟科技等明星創(chuàng)業(yè)公司。
盡管創(chuàng)業(yè)的時間與契機并不相同,但它們都共享著一個身份——清華系。
(相關(guān)資料圖)
在中國人工智能技術(shù)的發(fā)展史上,“清華系”注定是一個無法繞開的節(jié)點。這里是中國人工智能教育的原點之一,六十多年前,當一輛接新生的大卡車在夜色中徑直開到宿舍門口,彼時還未與人工智能結(jié)緣的張鈸院士還在心中感嘆「清華園真大」,距離清華計算機系正式成立「人工智能與智能控制」教研組也有數(shù)年。
而如今,在大模型掀起的新一輪AI浪潮下,「清華系」的創(chuàng)業(yè)者已成為了其間不可或缺的關(guān)鍵力量。為什么是清華?清華系崛起背后,又有何深意?
大模型浪潮里,“清華群星”閃耀時
任何創(chuàng)業(yè)圈都習慣為創(chuàng)業(yè)者貼上標簽,「標簽」既可以讓資本快速篩選優(yōu)質(zhì)標的,同樣也是初創(chuàng)企業(yè)最好的簡歷,而對技術(shù)密集型的企業(yè)而言,「學歷」無疑也是最好的標尺之一。
翻開此輪的大模型創(chuàng)業(yè)名單,無論是已有所成就的創(chuàng)業(yè)大佬,還是眼下的創(chuàng)業(yè)新手,“清華群星”幾乎占據(jù)了大壁江山。
曾經(jīng)的「互聯(lián)網(wǎng)四杰」,搜狗創(chuàng)始人王小川,在尚未創(chuàng)業(yè)時,媒體給他貼上的標簽是「清華天才少年」。這位被點招進入當時清華大學計算機系的學霸,幾乎每年還會參加清華計算機系的學生節(jié)?,F(xiàn)在,45歲的王小川有了一個新身份——大模型創(chuàng)企「百川智能」的創(chuàng)始人。
淡出創(chuàng)業(yè)圈多年后,這位曾經(jīng)的創(chuàng)業(yè)大佬選擇投身大模型,認為做大模型是一件特別適合自己的事。“大家沒人說過「小川適合做搜索」,但都說「百川適合做大模型」,對我來講,是一件非常幸運的事。”
而比王小川更早些選擇投身創(chuàng)業(yè)的,還有銜遠科技創(chuàng)始人周伯文,他是清華大學電子工程系的長聘教授。另一家被騰訊、米哈游、高瓴等明星機構(gòu)押注的MiniMax,其創(chuàng)始人為前商湯科技副總裁閆俊杰,閆本人也曾在清華大學計算機系從事博士后研究。
如王小川一樣的創(chuàng)業(yè)者往往參與或經(jīng)歷過大公司前沿技術(shù)的探索過程,他們的創(chuàng)業(yè)既是為了個人理想,也先天自帶商業(yè)化優(yōu)勢,信奉的是「大力出奇跡」。從百川智能先后推出開源和閉源的模型產(chǎn)品中就能看出,「借助先發(fā)優(yōu)勢,搶占身位」是他們從上一輪技術(shù)浪潮中學到的競爭法則。
另一派同屬清華系的創(chuàng)業(yè)者,無論從公司架構(gòu)還是發(fā)展歷史,其氣質(zhì)也更為「學術(shù)正統(tǒng)」。
由清華計算機系李涓子和唐杰教授擔任首席科學家的智譜AI,其孵化于清華的知識工程研究室(KEG)。該實驗室成立于上世紀九十年代,一開始走的就是「科研+工程化落地」的路線,而唐杰教授的得意門生楊植麟則在今年創(chuàng)立了月之暗面,其技術(shù)背景備受投資人青睞。
深言科技和面壁智能則脫胎于清華自然語言處理與社會人文計算實驗室(THUNLP)。THUNLP創(chuàng)立于上世紀七十年代,創(chuàng)建者為我國NLP領(lǐng)域的泰斗級人物黃昌寧教授,如今的學術(shù)帶頭人則為其弟子——清華大學計算機科學與技術(shù)系教授、清華大學人工智能研究院常務副院長孫茂松。而上述兩家創(chuàng)企的創(chuàng)始人均為孫茂松的學生。
隸屬于清華計算機系下的交互式人工智能課題組(CoAI),其學術(shù)帶頭人為朱小燕教授和黃民烈副教授。從CoAI里走出的聆心智能,對標的是大洋彼岸外的Character.AI。而由清華計算機系教授朱軍帶隊的新AI公司生數(shù)科技也已完成兩輪融資,朱軍師從清華大學計算機系教授、中科院院士張鈸。
學院派創(chuàng)業(yè)的特點是,一方面有著極強的技術(shù)基因,其產(chǎn)品背后的技術(shù)路線并非一日而就,而是代代師承的結(jié)果。另一方面,對比此前的AI創(chuàng)業(yè)熱潮,學者們?nèi)刖值乃俣日诩涌欤a(chǎn)投研一體化的趨勢突出。
如深言科技創(chuàng)始人豈凡超的恩師孫茂松擔任深言科技首席科學家,豈凡超想和教授交流時,只用走幾百米回學校,面壁智能背后也有智譜AI的參股,月之暗面的另一名創(chuàng)始成員也來自清華大學計算機系,和楊植麟師出同門。
另一方面,在此輪大模型創(chuàng)業(yè)背后的投資方中,“清華系”的創(chuàng)投者們也頗為矚目。包括圖靈創(chuàng)投、卓源資本、清華控股、水木清華校友種子基金、無限基金SEE Fund等清華系創(chuàng)投機構(gòu)也頻頻出手。如圖靈創(chuàng)投投了聆心智能、智譜AI,起源于清華大學FIT樓實驗室的卓源資本投了生數(shù)科技。
技術(shù)、人與錢,決定著此輪大模型創(chuàng)業(yè)的格局,清華在此輪競爭中似乎有著得天獨厚的優(yōu)勢。但另一個問題也隨之而來,為什么是清華?
“清華系”崛起:歷史、情懷與機制的勝利
今年6月,53歲的360創(chuàng)始人周鴻祎被清華大學計算機科學與技術(shù)系電子信息專業(yè)錄取,他在自己的微博上曬出一則錄取通知書,也引發(fā)了人們對清華大學與的人工智能學科建設的好奇。
事實上,在中國人工智能技術(shù)的發(fā)展史上,“清華”注定是一個無法繞開的節(jié)點。此輪大模型熱潮中,清華系之所以成為創(chuàng)業(yè)主力,背后是歷史、情懷與機制的支撐。
首先,離不開的是學科建設歷史的沉淀,這也是清華系的底層技術(shù)實力。
1978年,為了滿足國家發(fā)展計算機科技的需要,清華大學自動控制系更名為“計算機技術(shù)與應用系”,內(nèi)部同時成立了“人工智能與智能控制”教研組,正式探索人工智能方向的本科教學,張鈸院士回憶起當時的中國人工智能發(fā)展用“一窮二白”來形容:“當時國內(nèi)科研人員對人工智能領(lǐng)域發(fā)展的認識很有限,甚至相關(guān)資料也非常少。”
在對人工智能領(lǐng)域的初步了解后,學者們確定了幾個具體的方向,比如專家系統(tǒng)、自然語言、語音識別和智能控制等。但為了彌補與國外研究的差距,他們一邊向外看,去國外進修學習,將國外的先進知識翻譯到國內(nèi),同時開展前沿科研工作,另一邊則不斷探索與完善學院內(nèi)部的培養(yǎng)計劃。
彼時,張鈸院士作為訪問學者前往美國伊利諾伊大學香檳分校進修學習,黃昌寧教授則趕赴耶魯大學進行為期一年的訪問。據(jù)張鈸院士回憶,他通過將伊利諾伊大學使用的教材和相關(guān)材料全部復印并寄回國內(nèi),這些遠渡重洋的珍貴資料成為了輔助清華大學計算機系教研工作的利器之一。
于此同時,清華大學也開始為本科生開設《人工智能導論》等相關(guān)選修課,有效填補了當時國內(nèi)的課程空白。1983年,清華計算機系又將《人工智能》列為本科必修課程,相關(guān)教師也相繼編寫了人工智能方向的教材,如《人工智能原理》(石純一,林堯瑞)、《人工智能及其應用》(徐光佑編譯)、《人工智能手冊》(鐘玉琢編譯)等。
也是在這一時期,中國學者開始在世界人工智能界嶄露頭角。張鈸院士完成了中國科學家在人工智能領(lǐng)域的第一篇學術(shù)論文,并成功發(fā)表于人工智能領(lǐng)域頂級國際期刊上,由此開啟了人工智能發(fā)展的新篇章。
除了本科生教育體系的搭建,從1978年開始,清華開始招收人工智能碩士研究生,1986年,開始招收人工智能方向的博士生。同時通過建設一流的實驗室,加強國際合作與交流等舉措,清華不斷夯實其在人工智能領(lǐng)域的競爭力。
一個最典型的案例就是「姚班」的建立。清華大學利用企業(yè)的贊助資金,積極邀請世界著名的教授參與清華的培養(yǎng)工作。在2003年到2006年,圖靈獎獲得者姚期智作為受聘者,與清華結(jié)緣,而后直接回到清華大學擔任長聘教授,并創(chuàng)建了「姚班」。
「半數(shù)英才聚清華,清華英才在姚班」。如今從姚班已走出的一大批畢業(yè)生,也撐起了中國人工智能的半邊天。
歷史的沉淀外,創(chuàng)業(yè)情懷也是清華系的特點之一。在上一輪的互聯(lián)網(wǎng)創(chuàng)業(yè)潮中,清華系創(chuàng)業(yè)者身上就展現(xiàn)出了極強的創(chuàng)業(yè)意愿以及對事物本質(zhì)的探索精神,這在美團的王興、快手的宿華、豆瓣的阿北、搜狗的王小川身上都有明顯的體現(xiàn)。
而在此輪的大模型浪潮中,應用場景的選擇,商業(yè)模式的構(gòu)建以及技術(shù)路線的抉擇都需要這種回歸本質(zhì)的精神。換言之,創(chuàng)業(yè)者必須要對自身的優(yōu)勢與未來技術(shù)的發(fā)展作出較為準確的研判。
這之中,相較于智譜AI等較早入局大模型的創(chuàng)企,王小川的百川智能作為「后發(fā)者」,就先通過較快的產(chǎn)品迭代,借助過往的做搜索的優(yōu)勢,打出聲量,王小川的理解是“先填補國內(nèi)商業(yè)生態(tài)的空白”。周伯文的銜遠科技則是聚焦大模型對人與產(chǎn)品關(guān)系的重塑,聚焦消費品供應鏈這一垂直場景,這源于他過往在老東家京東的經(jīng)驗。
質(zhì)疑總縈繞在耳邊。比如,外界認為,做通用大模型是大廠的事。再比如,也有投資人對周伯文說:“你把事情做小了。”
但清華系創(chuàng)業(yè)者大多關(guān)注本質(zhì),對于「競爭」想的并不多。王興曾說過一句話:“太多人關(guān)注邊界,而不關(guān)注核心”。在清華大模型創(chuàng)業(yè)者身上,也有類似的創(chuàng)業(yè)氣質(zhì),他們接受競合是一種常態(tài)。
最后,清華系的崛起,也是一種開放機制的勝利。
其中,不得不提及的就是成立于2018年的北京智源人工智能研究院(以下簡稱:智源)。
這一獨立于政府、商業(yè)、和高校之外的非營利的新型科研機構(gòu),被稱為大模型行業(yè)的「黃埔軍?!?。微軟總裁布拉德?史密斯此前曾在一次采訪中認為:目前在人工智能領(lǐng)域,世界上三家公司處于絕對前列,一個是與微軟合作的Open AI,第二個是谷歌,第三個是北京智源人工智能研究院。
智源既是一個非盈利機構(gòu),一個技術(shù)社區(qū),同樣也是一個理想化的「烏托邦」。2020年,智源開始實踐大模型,啟動「悟道大模型」項目,不問英雄出處。根據(jù)「雷鋒網(wǎng)」的報道,包括清華、人大、北大、中科院等高校的學者與老師,一些外部成員也參與了進來,組團攻克中國大模型的難關(guān)。這個項目里集合了如今我們所知道的諸多清華系的大模型創(chuàng)業(yè)者:唐杰、劉知遠、黃民烈、楊植麟......
可以這么說,立于大模型浪尖的清華,其崛起既是前人探索的沉淀,同樣也是當代「產(chǎn)學研」創(chuàng)新機制下的結(jié)果。
大模型的競爭,歸根到底是「人」的競爭
清華系崛起,五道口造夢。一切商業(yè)競爭,回歸本質(zhì)依舊還是關(guān)于「人」的競爭。
大洋彼岸外,表面正酣的大模型熱潮,谷歌和OpenAI的人才戰(zhàn)爭則是水面下的暗線。據(jù)媒體報道,在過去的五年里,超過30位高管、工程師或其他員工離開了OpenAI選擇創(chuàng)業(yè),據(jù)「量子位」統(tǒng)計,OpenAI的51位研究人員中,有16位人才離開了OpenAI,離職率高達三分之一。這群OpenAI的叛逃者被稱為“OpenAI黑手黨”。
而他們所構(gòu)建的人脈網(wǎng)與資本網(wǎng),將聰明的人與聰明的錢串聯(lián)在了一起,這種獨特的「叛徒文化」既帶來了一個各司其職、分工明確的創(chuàng)新生態(tài),也鑄就了多元與豐富的「獨角獸土壤」。
當然,中美國情的差異化,OpenAI的故事注定無法復現(xiàn),可能的原因有三:
一是,時間的差異,區(qū)別于美國應用層的繁榮,中國大模型底層格局依舊未定,因此應用層發(fā)展仍在初期。
二是,路線的分化。美國大模型注重底層技術(shù)的研發(fā)與創(chuàng)新,例如在硬件和深度學習框架上都處于世界領(lǐng)先地位。而中國更聚焦在應用層,強調(diào)融入產(chǎn)業(yè),以及商業(yè)的變現(xiàn)。
三是,塔尖人才分布的差異。根據(jù)未盡研究的統(tǒng)計,在全球范圍內(nèi)入選人工智能學科AI2000名單的頂尖學者中,美國多是來自于科技企業(yè)。例如,谷歌、微軟、Meta合計招攬了三成的美國頂級學者。而中國的人工智能頂尖研究人員,壓倒性地來自高校,阿里巴巴則是中國招攬了最多頂級學者的企業(yè)。
「清華系崛起」背后,釋放出了一個新信號:從研究到創(chuàng)新,從象牙塔到企業(yè),更多的頂尖人才正借助商業(yè)力量推動技術(shù)創(chuàng)新實現(xiàn)具體應用場景的落地。更多的青年科學家也正在以自己的方式,帶來新的創(chuàng)新。
區(qū)別于上一輪的互聯(lián)網(wǎng)創(chuàng)業(yè)潮,此輪的大模型熱潮似乎已不是一個「以輸贏論英雄」的年代。清華大模型的創(chuàng)業(yè)圖譜已然說明了一切,它包容多元,歡迎創(chuàng)新,也樂于共享,甚至超出了單純的競爭思維。
但挑戰(zhàn)依舊擺在眼前。如何提升創(chuàng)新效率,建立更健康的創(chuàng)新生態(tài),這既需要創(chuàng)業(yè)者對自身有著更精確的定位,對技術(shù)有敏銳與理智研判,同樣也依賴于政策、資本與學界的合力,探索出一套更先進與高效的合作方式。
參考資料:
1、雷鋒網(wǎng):《五道口簡史》2、張鈸院士:《清華辦AI,除了洞見,更有沉淀》3、晚點LatePost:《大模型創(chuàng)業(yè)潮:狂飆180天》4、科學中國人:《張鈸:人工智能,從過去到未來》5、創(chuàng)頭條:《AI江湖里的“清華幫”》6、投資界:《最近,清華系創(chuàng)始人太火了》7、中國企業(yè)家雜志:《中國的OpenAI,藏在這幾棟樓里》8、清華小五爺園:《馬少平 周楓 王小川 樓天城 唐文斌:清華計算機系與人工智能40年》9、雷鋒網(wǎng):《之江實驗室陳紅陽:大模型要落到實處,必須要解決背后的算力缺口》10、經(jīng)濟觀察報:《周伯文:未知與先覺丨AI·20人系列報道》
關(guān)鍵詞: