女人久久久,最近更新中文字幕在线,成人国内精品久久久久影院vr,中文字幕亚洲综合久久综合,久久精品秘?一区二区三区美小说

原創(chuàng)生活

國內(nèi) 商業(yè) 滾動

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費

生活滾動

保險 海外 觀察

財經(jīng) 生活 期貨

當前位置:科技 >

環(huán)球視點!達摩院天貓精靈聯(lián)合研發(fā)數(shù)字人:大模型訓練、大規(guī)模交互將帶來什么?

文章來源:鈦媒體APP  發(fā)布時間: 2022-11-07 17:00:01  責任編輯:cfenews.com
+|-

11月7日消息,阿里巴巴多個團隊正聯(lián)合研發(fā)由數(shù)字人全面接管的終端交互引擎。預計第一款“數(shù)字人+終端”產(chǎn)品將在2023年一季度讓用戶體驗。

項目集合達摩院NLP、語音、視覺、3D構建驅(qū)動及大模型領域團隊,和天貓精靈AliGenie交互系統(tǒng)專家。就像手指觸屏奠定智能手機交互,大模型數(shù)字人將接管未來智能交互。2022年開始,達摩院多模態(tài)大模型開始應用于天貓精靈語音搜索與百科場景。各方目前將合作場景推向AliGenie交互的系統(tǒng)層和用戶感知層。


(資料圖片)

數(shù)字人領域正由喧囂轉(zhuǎn)向理性。雖然高精度高顏值的人偶形象不斷出現(xiàn),但絕大部分場景缺乏與用戶的持續(xù)性、個性化互動,進而商業(yè)化規(guī)模有限。如,只能在短視頻和動畫中存在的虛擬偶像?;蛑辉趩我辉O備或界面中面向大眾支持問答的虛擬員工,這些形態(tài)缺乏大模型訓練和大規(guī)模交互,無法個性化學習升級,用戶感受就像“沒有靈魂”。

數(shù)字人Inside,接管終端——則是阿里巴巴正在嘗試的新方式。云棲大會上,阿里巴巴集團研究員李小龍透露列舉了達摩院積累的包括多模態(tài)大模型、語音、自然語言、3D構建驅(qū)動、各個領域近兩年百項專利與頂會論文,通過將這些成果,在諸多交互場景驗證,一個多模態(tài)大模型為基礎的數(shù)字人的引擎已初顯雛形。

圖:李小龍介紹全新數(shù)字人引擎技術架構

天貓精靈產(chǎn)品規(guī)劃負責人盧勇介紹,接入AliGenie系統(tǒng)的終端已覆蓋4000多萬家庭、包含1600多個品牌的4.6億已接入產(chǎn)品,能讓數(shù)字人在可持續(xù)、大規(guī)模、組合式的場景與用戶交互。AliGenie此前公布,僅智能音箱產(chǎn)品每月交互80億次以上,70%是主動型服務。許多消費硬件領域廠商,也迫切希望有超出單一連接、單一設備對話的智能體驗。

以多模態(tài)大模型驅(qū)動的智能化,理論上也非常適合缺乏數(shù)據(jù)、場景碎片化的智能終端場景。例如,由通義多模態(tài)大模型(BroadScope)訓練的數(shù)字人,可以具備可泛化的認知驅(qū)動能力,數(shù)字人根據(jù)音樂進行舞蹈、根據(jù)文字產(chǎn)生行動,改變了過去完全要單一維度數(shù)據(jù)訓練的模式,能夠讓數(shù)字人遷移場景進行服務。

圖:大模型將提升數(shù)字人的自主對話能力

在云語音語義技術方面,Gartner 2022報告顯示,阿里綜合能力居全球第二。阿里團隊還在Wizard of Wiki(知識對話)、Commonsense QA(常識問答)和VQA(視覺問答)三項全球評測中連續(xù)獲得冠軍,并超過人類能力基準。

以天貓精靈日常對話場景為例,通過大模型底座進一步訓練的對話大模型mPLUG-dialog,將可能成為包含知識、情感、個性、記憶的全新交互系統(tǒng)。

在內(nèi)容上,不再是單純地按知識庫或搜索結(jié)構在檢索和回答問題,而是綜合這四個維度,努力給出更有趣更有情商的回復,在聲音上,不再是字正腔圓的播報音,會包含更豐富更細膩的情緒。實時溝通時,AI不僅能被隨時打斷,也能穩(wěn)定接茬,還會主動追問。

關鍵詞:

專題首頁|財金網(wǎng)首頁

原創(chuàng)
新聞

精彩
互動

獨家
觀察

京ICP備2021034106號-38   營業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com  財金網(wǎng)  版權所有  cfenews.com