小米總部園區(qū)
在小米公司CEO雷軍演講前夕,其研發(fā)的人工智能(AI)大模型產(chǎn)品悄然現(xiàn)身。
鈦媒體App獲悉,8月11日,小米公司開發(fā)的大規(guī)模預(yù)訓(xùn)練語言模型 MiLM-6B/1.3B登陸代碼托管平臺(tái)GitHub,參數(shù)規(guī)模最高達(dá)64億,而且現(xiàn)身在C-Eval、CMMLU基準(zhǔn)評(píng)測(cè)榜單。
(資料圖)
截至當(dāng)前,小米大模型MiLM-6B在C-Eval總榜單排名第10、同參數(shù)量級(jí)排名第1,平均分為60.2分,超過了阿里云Qwen-7B、OpenAI研發(fā)的ChatGPT(今年5月數(shù)據(jù))等,而MiLM-1.3B排行第30名,平均分45.8分,接近谷歌投資的Anthropic公司的Claude 1.0版本大模型。
這是小米大模型產(chǎn)品的首次曝光,也是小米史上首個(gè)GPT大模型產(chǎn)品亮相。
事實(shí)上,隨著ChatGPT風(fēng)靡全球,今年4月14日,小米公司宣布成立小米 AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì),由欒劍帶隊(duì)向王斌匯報(bào)。據(jù)悉,AI實(shí)驗(yàn)室是小米AI戰(zhàn)略的核心部門,而大模型負(fù)責(zé)人王斌曾在中科院從事了20多年NLP(自然語言處理)相關(guān)的研究和開發(fā)工作,2018年加入小米,2019年起負(fù)責(zé)AI實(shí)驗(yàn)室。
小米CEO雷軍當(dāng)時(shí)表示,公司正在研發(fā)一些技術(shù)和產(chǎn)品,等打磨好了再給大家演示。小米集團(tuán)總裁盧偉冰稱,小米目前擁有超過1200人的AI團(tuán)隊(duì),會(huì)積極擁抱大模型,與業(yè)務(wù)深度結(jié)合,但不會(huì)像OpenAI一樣。
今年6月,王斌對(duì)外透露,小米會(huì)去自研通用語言大模型,但不會(huì)單獨(dú)發(fā)布一款類ChatGPT產(chǎn)品。他表示,小米第一步的目標(biāo)基座模型參數(shù)在幾百億,而且小米大模型將會(huì)落地小愛同學(xué)、loT、自動(dòng)駕駛、機(jī)器人等現(xiàn)有場(chǎng)景中,并利用豐富的應(yīng)用場(chǎng)景反哺大模型能力。
成立僅僅四個(gè)月后的今天,小米公布了大模型產(chǎn)品——MiLM-6B,并在C-Eval和CMMLU基準(zhǔn)評(píng)測(cè)上均取得同尺寸較好效果。
其中,在C-Eval評(píng)估中,MiLM-6B的平均得分為60.2,在不同學(xué)科和難度級(jí)別(如STEM、社會(huì)科學(xué)、人文學(xué)科等)得分從42分到71.7分不等。在CMMLU評(píng)估中,MiLM-6B在零樣本和五樣本測(cè)試中的平均得分分別為60.37分和57.17分,表現(xiàn)出良好的知識(shí)和推理能力。
據(jù)悉,C-Eval榜單是清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)共同構(gòu)建的綜合漢語模型評(píng)估套件,而CMMLU則是綜合漢語模型基準(zhǔn)。
預(yù)計(jì)小米將會(huì)于8月14日舉行2023雷軍年度演講,但目前雷軍暫未透露是否會(huì)發(fā)布MiLM-6B大模型技術(shù)。
鈦媒體App向團(tuán)隊(duì)詢問關(guān)于MiLM-6B/1.3B是否開源、產(chǎn)品是否已經(jīng)落地內(nèi)測(cè)等問題,截至發(fā)稿前暫未得到小米官方回復(fù)。(本文首發(fā)鈦媒體App,作者|林志佳)
關(guān)鍵詞: