今年6月北京舉行的安博會上 AI 產品展示(來源:鈦媒體App編輯拍攝)
ChatGPT持續(xù)引發(fā)中國人工智能(AI)大模型賽道的投資熱潮。
鈦媒體App獨家獲悉,8月9日,生成式AI公司北京生數科技有限公司(簡稱“生數科技”)宣布完成數千萬元天使+輪融資,本輪由錦秋基金投資,資金將主要用于算法研發(fā)、產品開發(fā)和團隊擴充。
【資料圖】
此前6月,生數科技宣布完成螞蟻集團、BV百度風投、卓源資本近億元的天使輪融資,首輪融資后估值1億美金。而僅過去不到兩個月,生數科技又一次連續(xù)完成第二輪投資。(詳見鈦媒體App前文:《螞蟻、百度聯(lián)合投資AIGC賽道,生數科技首輪融資后估值1億美金》)
生數科技CEO唐家渝對鈦媒體App表示,公司正計劃打造百億級參數量的大模型。相較于其他團隊,生數的核心壁壘在于多模態(tài)大模型架構的原創(chuàng)先進性、持續(xù)的底層算法創(chuàng)新能力等,團隊已研發(fā)出開源大模型Unidiffuser。
“目前在文生圖場景中,我們的效果已經達到了Stable Diffusion最新版基礎模型效果,但與Midjourney相比還有一定差距,主要是美學性方面,我們預計年底會達到Midjourney最新版的效果?!碧萍矣灞硎?。
據悉,生數科技成立于2023年3月,是全球領先的生成式 AI 基礎設施及應用提供商,由清華系 AI 公司瑞萊智慧RealAI、螞蟻集團和百度發(fā)起的BV百度風投聯(lián)合孵化成立,致力于打造可控多模態(tài)通用大模型。唐家渝此前曾任瑞萊智慧副總裁。
產品方面,今年3月,生數科技團隊已發(fā)布9.5億參數的開源多模態(tài)大模型Unidiffuser,采用基于Transformer架構的底層統(tǒng)一網絡框架U-ViT,實現(xiàn)圖文模態(tài)之間的任意跨模態(tài)生成。
唐家渝告訴鈦媒體App,目前,業(yè)界主要集中在解決兩大核心問題:一是讓模型能理解和對齊多種模態(tài)的數據;二是使模型能生成各種模態(tài)的內容。大多數方法仍然依賴于組合多個模型來處理多模態(tài)數據,但Unidiffuser利用U-ViT架構,成功地將文本和圖像整合到一個框架中,而且其閉源版本還進一步整合了3D和視頻內容。
目前,生數科技團隊的研發(fā)核心主要有兩方面:一是在Unidiffuser核心架構設計的基礎上自主研發(fā)更高參數量的產業(yè)級大模型,在文本、圖像的基礎上融入3D、視頻等更多模態(tài)數據,現(xiàn)階段已實現(xiàn)百億數據、數十億參數規(guī)模的通用大模型內測,支持文圖生成、3D生成和視頻元素編輯等功能;二是基于底層通用模型能力,研發(fā)面向圖像創(chuàng)作、3D資產創(chuàng)建等內容創(chuàng)作場景打造“AI工具集”,產品將于今年底前推出。
商業(yè)化方面,唐家渝向鈦媒體App透露,生數科技商業(yè)化路徑分兩部分:一方面是開發(fā)面向終端用戶的應用,例如圖像創(chuàng)作助理、3D資產生成平臺,以訂閱等形式收費;另一方面,面向B端機構,提供調用模型服務。
“我們希望幫助個人用戶解決細分場景下的圖像創(chuàng)作需求,同時能實現(xiàn)高質量效果。目前,我們一款內測的產品就是定位個人圖像創(chuàng)作助理,圍繞更通用底層的圖像創(chuàng)造和編輯需求,真正做到言出法隨,讓用戶用特別簡單的指令和交互就能創(chuàng)造出理想的圖像。難點涉及到底層模型可控生成方面的技術突破,以及對于普通用戶在圖像創(chuàng)作和編輯需求意圖方面的深刻理解?!碧萍矣灞硎?。
唐家渝認為,相比語言類大模型,在多模態(tài)大模型方向,國內與國外的研究都處于早期探索階段,并沒有形成明顯的差距,均面臨包括架構層面解決多模態(tài)數據對齊、模態(tài)的統(tǒng)一和通用,以及大模型指令微調等問題,目前全球都還處于早期的技術研究和驗證階段,所以國內外差距不明顯。而且在某些工作方向,國內已經領先于國外。
值得注意的是,生數科技此輪投資方“錦秋基金”與字節(jié)跳動關系密切。該基金成立于2022年3月,由原字節(jié)跳動財務投資負責人楊潔Janna創(chuàng)立,創(chuàng)始成員多數來自于原字節(jié)跳動投資團隊以及國內頂級風險投資機構和知名產業(yè)公司,專注于早期和成長期投資。早前,楊潔還曾供職于紅杉資本、深創(chuàng)投、同創(chuàng)偉業(yè)等。
目前,錦秋基金主要聚焦AI和出海領域,已投資海外電商服務平臺Jet Commerce等,并且楊潔在未來機器人、鯊魚菲特、零犀科技等多家企業(yè)有任職。
針對此次融資,錦秋基金投資副總裁鄭曉超表示,大模型和生成式AI正引領當前最大的一波科技新浪潮,催生了全新的生產力工具和應用產品的出現(xiàn),但其核心驅動力仍來自于底層模型的創(chuàng)新。生數科技團隊不僅聚焦底層技術創(chuàng)新,擁有深度生成式模型的骨干網絡、高速采樣、可控生成等全棧研發(fā)能力,具備從0到1訓練全球最大擴散模型的深厚技術實力。同時在商業(yè)化產品探索層面,生數科技團隊也具有極強的工程化能力和產品創(chuàng)新能力。
唐家渝表示,生成式AI技術將讓每個人都能更好地進行表達和創(chuàng)造,當想象力不再被局限,生產效率將大幅提升,傳統(tǒng)的生產關系和人機交互模式也將得以重塑。未來生數科技將持續(xù)打磨通用大模型和應用產品,致力于通過不斷解放想象力進而提升全人類的創(chuàng)造力和生產力。(本文首發(fā)鈦媒體App,作者|林志佳)
關鍵詞: