女人久久久,最近更新中文字幕在线,成人国内精品久久久久影院vr,中文字幕亚洲综合久久综合,久久精品秘?一区二区三区美小说

原創(chuàng)生活

國(guó)內(nèi) 商業(yè) 滾動(dòng)

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費(fèi)

生活滾動(dòng)

保險(xiǎn) 海外 觀察

財(cái)經(jīng) 生活 期貨

當(dāng)前位置:科技 >

環(huán)球消息!掰開揉碎告訴你,ChatGPT憑啥是人工智能“流量王”

文章來(lái)源:鈦媒體APP  發(fā)布時(shí)間: 2023-05-29 10:05:43  責(zé)任編輯:cfenews.com
+|-

從AI繪畫的出圈,到如今OpenAI公司的ChatGPT的火爆,人工智能發(fā)展史上一個(gè)新的里程碑驚現(xiàn)于世。

據(jù)公開資料報(bào)道,ChatGPT上線5天就獲得了100萬(wàn)用戶,不到兩個(gè)月就突破1億月活用戶。而此前,iPhone獲得100萬(wàn)用戶的時(shí)間為74天,TikTok實(shí)現(xiàn)1億月活用戶的時(shí)間為9個(gè)月。可見,ChatGPT的“吸粉”能力非同一般。

與此同時(shí),ChatGPT也給資本市場(chǎng)掀起了一陣海浪。據(jù)公開媒體報(bào)道,微軟將在此前先后投資OpenAI公司30億美元的基礎(chǔ)上,再追加100億美元投資;谷歌將出資3億美元收購(gòu)OpenAI公司前雇員的初創(chuàng)公司Anthropic的競(jìng)品Claude;有美國(guó)版“今日頭條”之稱的BuzzFeed公司在官宣準(zhǔn)備引入ChatGPT作為內(nèi)容生產(chǎn)工具后股價(jià)立即飆升……當(dāng)國(guó)內(nèi)眾多公司宣布正在或準(zhǔn)備入局ChatGPT的競(jìng)品研發(fā)與應(yīng)用時(shí),國(guó)內(nèi)A股市場(chǎng)一陣狂歡。


(相關(guān)資料圖)

與一般的面向客服QA問(wèn)答和專業(yè)任務(wù)型智能聊天機(jī)器人不同,ChatGPT可以根據(jù)人們的“提示”進(jìn)行詩(shī)歌創(chuàng)作、問(wèn)題探討、報(bào)告撰寫、提綱設(shè)計(jì)、摘要?dú)w納、論文寫作和代碼編寫,甚至可用于參加各類考試。因其面向開放領(lǐng)域、可連續(xù)式問(wèn)答、良好的用戶體驗(yàn)和看似無(wú)所不能的能力,火速成為政產(chǎn)學(xué)研等各領(lǐng)域各行業(yè)的街巷熱議,以至于微軟創(chuàng)始人比爾?蓋茨把ChatGPT出現(xiàn)的意義與當(dāng)年的PC和互聯(lián)網(wǎng)相提并論。

作為一款人工智能聊天機(jī)器人,ChatGPT何以能成為人工智能發(fā)展以來(lái)的“流量爆款”?它為人工智能之路昭示了出什么樣的方向,又帶給我們?cè)鯓拥膯l(fā)?本文將圍繞ChatGPT的出發(fā)點(diǎn)、生成式AI、人工智能算法框架技術(shù)演進(jìn)、預(yù)訓(xùn)練大模型PLM、人工智能內(nèi)容生成AIGC進(jìn)行討論,希望給讀者以有益的啟發(fā)。

01出發(fā)點(diǎn):ChatGPT的第一性原理思維

什么是第一性原理思維?

簡(jiǎn)單來(lái)說(shuō)就是回歸本質(zhì),再進(jìn)行重構(gòu)。從第一性原理思維角度來(lái)看,就像PC、互聯(lián)網(wǎng)、智能手機(jī)、移動(dòng)互聯(lián)網(wǎng)的演進(jìn)路線一樣,人工智能只有走向通用人工智能AGI,才有可能成為人們工作和生活過(guò)程中不可或缺的一部分,也才會(huì)產(chǎn)生真正的變革。反過(guò)來(lái),也才會(huì)促進(jìn)與加速人工智能的發(fā)展,“人工智障”才有可能徹底改變。

如今,以人工智能技術(shù)、機(jī)器人技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、量子信息技術(shù)、可控核聚變、清潔能源以及生物技術(shù)為突破口的第四次工業(yè)革命已經(jīng)到來(lái),人類社會(huì)已進(jìn)入到一個(gè)萬(wàn)物互聯(lián)的智能時(shí)代,機(jī)器將具有感知、判斷和推理能力,將自行產(chǎn)生知識(shí),從而增強(qiáng)和替代人類知識(shí),將人從腦力勞動(dòng)中解決出來(lái)。從第一性原理思維角度看,幾次工業(yè)革命演進(jìn)的本質(zhì)是機(jī)器逐漸取代人力,包括體力和腦力,從而不斷提高社會(huì)生產(chǎn)效率和社會(huì)生產(chǎn)力,直到最終部分或全部取代人。

自上世紀(jì)50年代中期,人工智能的發(fā)展幾經(jīng)高漲與低落。最近十年,隨著大數(shù)據(jù)、云計(jì)算以及基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的發(fā)展,特別是以2016年谷歌旗下DeepMind公司的阿爾法狗(AlphaGo)戰(zhàn)勝韓國(guó)圍棋九段棋手李世石事件為標(biāo)志,人工智能又迎來(lái)一個(gè)突飛猛進(jìn)的春天。圖像識(shí)別、人臉識(shí)別、視覺計(jì)算和自然語(yǔ)言處理等人工智能技術(shù)與產(chǎn)品如雨后春筍般涌現(xiàn),廣泛應(yīng)用于智能客服、推薦系統(tǒng)、智能風(fēng)控、智能診斷和異常檢測(cè)等各領(lǐng)域各行業(yè)。

然而,與這些通過(guò)預(yù)設(shè)的算法或訓(xùn)練解決特定問(wèn)題、只對(duì)某一方面有自動(dòng)化專業(yè)能力的專用人工智能如火如荼的發(fā)展境遇不同,具有人類思維水平及心理結(jié)構(gòu)的全面性智能化的通用人工智能AGI一直未能有喜人的進(jìn)步。“人工智障”一直是對(duì)此前專用人工智能發(fā)展的揶揄。

究其原因,主要有三:一是專用人工智能的應(yīng)用仍然居“廟堂之高”,類似互聯(lián)網(wǎng)的早期,只是專業(yè)人士手中的“炫技”,未能飛尋常百姓手中;二是人機(jī)交互體驗(yàn)不友好,往往需要一定的專業(yè)技能才能操作;三是固化的“智能”,迭代升級(jí)成本高昂,缺乏像人類一樣的自學(xué)習(xí)與思考。

人工智能只有走向通用人工智能AGI,才會(huì)產(chǎn)生真正的變革,促進(jìn)與加速人工智能的發(fā)展。無(wú)疑,ChatGPT很好地把握了這一點(diǎn)。

首先,ChatGPT面向開放領(lǐng)域,不囿于某一專業(yè)領(lǐng)域,可進(jìn)行詩(shī)歌創(chuàng)作、問(wèn)題探討、報(bào)告撰寫、提綱設(shè)計(jì)、摘要?dú)w納、論文寫作和代碼編寫,初步具有一定級(jí)別的人類思維水平,具有參加MBA、法律、醫(yī)學(xué)等各種專業(yè)考試能力,看似上知天文、下通地理、無(wú)所不能,類似“知識(shí)百科”。隨著應(yīng)用的不斷深入以及不斷從人類反饋中學(xué)習(xí),ChatGPT將不斷接近直至達(dá)到人類思維水平。正如OpenAI公司創(chuàng)始人兼首席執(zhí)行官山姆·阿爾特(Sam Altman)在今年1月中旬接受《福布斯》采訪時(shí)表示:“AGI是驅(qū)動(dòng)我所有行動(dòng)的推動(dòng)力”??梢?,ChatGPT只是通往通用人工智能AGI之路的起點(diǎn)。

其次,ChatGPT很好地選擇了以自然語(yǔ)言作為人機(jī)交互界面,用戶只需輸入“提示”就能得到“答復(fù)”,而不需要操作鍵盤和鼠標(biāo)(互聯(lián)網(wǎng)時(shí)代的PC)或觸控(移動(dòng)互聯(lián)網(wǎng)時(shí)代的智能手機(jī))。良好的用戶體驗(yàn)極大地消除了產(chǎn)品與使用、機(jī)器與人之間的“數(shù)字鴻溝”,這便是科技的第一性原理思維。事實(shí)上,早在2016年的微軟全球開發(fā)者大會(huì)上,微軟就提出“對(duì)話即平臺(tái)”CAAP理念。智能時(shí)代,人機(jī)交互的媒介將是“對(duì)話”。

再次,與其他人工智能產(chǎn)品不同,“從人類反饋中強(qiáng)化學(xué)習(xí)”是ChatGPT獨(dú)一無(wú)二的創(chuàng)新。首先基于海量的語(yǔ)料數(shù)據(jù)預(yù)訓(xùn)練出一個(gè)語(yǔ)言大模型(GPT-3.5),然后在此基礎(chǔ)上通過(guò)少量的人工標(biāo)注數(shù)據(jù)對(duì)GPT-3.5進(jìn)行監(jiān)督學(xué)習(xí)微調(diào)SFT;然后再用幾個(gè)SFT模型對(duì)無(wú)標(biāo)注數(shù)據(jù)進(jìn)行測(cè)試,并對(duì)多個(gè)答復(fù)按好壞程度進(jìn)行排序并標(biāo)注(不同模型會(huì)給出不同的“答復(fù)”),以此標(biāo)注數(shù)據(jù)繼續(xù)訓(xùn)練出一個(gè)“獎(jiǎng)勵(lì)模型”RM(鼓勵(lì)模型給出盡可能跟用戶“提示”相匹配的答案,強(qiáng)化模型的一致性);最后通過(guò)獎(jiǎng)勵(lì)模型RM制定一種稱之為“近端策略優(yōu)化” PPO的算法,以持續(xù)優(yōu)化模型參數(shù)。其原理示意圖如下圖1所示。

圖1 ChatGPT的RLFH原理示意圖

“第一性原理”是一種思維方法,強(qiáng)調(diào)從事情最根本的真理入手,透過(guò)事物表象,一層層剝開事物,看到事物的本質(zhì)。然后再?gòu)淖畋举|(zhì)處一層一層往外進(jìn)行推理——人工智能造福世人最根本的真理是通用人工智能AGI,而ChatGPT為通往通用人工智能AGI之路開啟了一道門。

02?新范式:生成式AI(Generative AI)

如前文所言,作為一個(gè)產(chǎn)品,ChatGPT本質(zhì)上是一款人工智能聊天機(jī)器人。但與一般人工智能聊天機(jī)器人不同,ChatGPT走的是第四種技術(shù)路線,它是一種生成式模型。從應(yīng)用的角度來(lái)看,人工智能AI可分為判別式/分析式AI和生成式AI,而ChatGPT屬于“生成式AI”。

人工智能聊天機(jī)器人的出現(xiàn)已有一段時(shí)間了,如亞馬遜的智能聊天機(jī)器人Alexa、蘋果公司的Siri、微軟的Cortana、谷歌的Allo及國(guó)內(nèi)其他眾多產(chǎn)品。

從技術(shù)路線來(lái)看,人工智能聊天機(jī)器人可分為四種:基于規(guī)則、基于檢索、基于語(yǔ)義解析和基于深度學(xué)習(xí)的生成模型。其中,基于規(guī)則的方法需要由專業(yè)人員編寫相應(yīng)的人工規(guī)則;基于檢索的方法則需要事先根據(jù)先驗(yàn)知識(shí)編制成對(duì)的<提示,回復(fù)>語(yǔ)料庫(kù),應(yīng)用時(shí),首先在語(yǔ)料庫(kù)中檢索用戶的“提問(wèn)”,比對(duì)“提問(wèn)”與“提示”(可能得到多個(gè)<提示,回復(fù)>對(duì)),然后利用rank模型(語(yǔ)義匹配模型)對(duì)“提問(wèn)”和“回復(fù)”進(jìn)行打分,最后利用打分的結(jié)果得到相應(yīng)的回復(fù);而基于語(yǔ)義解析的方法,是對(duì)每一句話進(jìn)行深度自然語(yǔ)言處理之后,提取關(guān)鍵的語(yǔ)法語(yǔ)義信息,并生成相應(yīng)的回復(fù);最后一種是基于海量數(shù)據(jù)和深度模型的生成方法,根據(jù)接收到的輸入(“提問(wèn)”)生成語(yǔ)料庫(kù)中沒有的新文本(“回復(fù)”)。

在生成式AI之前,我們耳熟能詳?shù)腁I應(yīng)用如垃圾郵件識(shí)別、風(fēng)控模型、智能推薦(短視頻、網(wǎng)購(gòu)等)、人臉識(shí)別、異常檢測(cè)和自動(dòng)駕駛等等,都屬于判別式/分析式AI應(yīng)用。判別式/分析式AI是根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷、預(yù)測(cè),用于輔助決策。例如,如果我們要讓計(jì)算機(jī)從圖片中識(shí)別出狗,我們就先準(zhǔn)備一批圖片中有狗的樣本圖片,并標(biāo)注出一系列可以判斷圖片是狗的要素特征,如“翹起的耳朵”“渾身長(zhǎng)毛”“有尾巴”等,然后選擇機(jī)器學(xué)習(xí)算法,如邏輯回歸、決策樹、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等等,也可以是基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)算法CNN或其他,讓計(jì)算機(jī)對(duì)這些樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),從中摸索出足以判斷某個(gè)圖形是狗的規(guī)律,以此得到一個(gè)判別模型。日后就可以用此判別模型來(lái)判斷新的圖片中是否有狗。

而生成式AI更強(qiáng)調(diào)學(xué)習(xí)歸納后進(jìn)行演繹創(chuàng)造,生成全新的內(nèi)容。其背后的技術(shù)基礎(chǔ)來(lái)源于一種稱為“生成式對(duì)抗網(wǎng)絡(luò)”GAN的思想原理。

生成式對(duì)抗網(wǎng)絡(luò)GAN也是一種深度學(xué)習(xí)模型,由著名的深度學(xué)習(xí)理論專家伊恩·古德費(fèi)洛(Ian J. Goodfellow)于2014年提出。一個(gè)GAN是由一個(gè)生成模型G和一個(gè)判別模型D構(gòu)成。生成模型捕捉真實(shí)數(shù)據(jù)樣本的潛在分布,并由潛在分布生成新的數(shù)據(jù)樣本;判別模型是一個(gè)二分類器,判別輸入是真實(shí)數(shù)據(jù)還是生成的樣本。這兩個(gè)模型交替訓(xùn)練,即生成模型不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別模型則不斷區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。直至判別模型已經(jīng)無(wú)法判別是真還是假,生成模型G便形成。如下圖2所示。

圖2 GAN原理圖

ChatGPT采用這一概念,并將其應(yīng)用于基本文本的對(duì)話,以及創(chuàng)造軟件代碼。它使用GAN生成對(duì)輸入文本的響應(yīng),使其能夠與人類進(jìn)行聽起來(lái)自然的話,讓它的回答表現(xiàn)得更像一個(gè)人。

2021知名調(diào)查機(jī)構(gòu)Gartner在2021年高德納IT博覽會(huì)上,發(fā)布2022年需要探索的十二大重要戰(zhàn)略技術(shù)趨勢(shì)。其中,生成式AI位列其中。由于生成式AI能從數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο螅⑦\(yùn)用數(shù)據(jù)生成全新的、完全原創(chuàng)的、逼真的設(shè)備,本質(zhì)上是對(duì)生產(chǎn)力的大幅度提升和創(chuàng)造。至目前,生成式AI已催生了營(yíng)銷、設(shè)計(jì)、建筑和內(nèi)容領(lǐng)域的創(chuàng)造性工作,并開始在生命科學(xué)、醫(yī)療、制造、材料科學(xué)、媒體、娛樂(lè)、汽車和航空航天等行業(yè)領(lǐng)域進(jìn)行初步應(yīng)用。

從判別式/分析式AI向生成式AI演變,已成了AI開發(fā)的新范式。

03新驅(qū)動(dòng):?????注意力機(jī)制

自然語(yǔ)言處理中常用的一種通用算法框架是編碼器-解碼器網(wǎng)絡(luò)。其中,編碼器是將輸入序列“編碼”為一個(gè)輸出(向量C),解碼器是將該輸出(向量C)作為輸入“解碼”為一個(gè)輸出序列。在這個(gè)框架下可以使用不同的算法來(lái)解決不同的任務(wù),它們也被應(yīng)用于摘要和圖像說(shuō)明生成任務(wù)。如下圖3所示。

圖3 編碼器-解碼器網(wǎng)絡(luò)示意圖

傳統(tǒng)上,編碼器-解碼器網(wǎng)絡(luò)用得比較多的是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN——通常是其變種:長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM或是門控循環(huán)單元GRU。不過(guò),基于循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的編碼器—解碼器網(wǎng)絡(luò)存在三個(gè)特點(diǎn):一是要求輸入序列和輸出序列要等長(zhǎng),二是不論輸入和輸出的長(zhǎng)度是什么,中間的“向量C”的長(zhǎng)度都是固定的,三是從序列輸入到序列輸出是“串行”模式,模型訓(xùn)練效率低。這三個(gè)特點(diǎn)對(duì)于生成式預(yù)訓(xùn)練大模型建模是缺陷。

例如,對(duì)于語(yǔ)言翻譯任務(wù),如將“早上好”翻譯為“Good Morning”,輸入序列長(zhǎng)度為3,輸出序列長(zhǎng)度為2,顯然第一特點(diǎn)存在缺陷。中間向量C的固定長(zhǎng)度對(duì)于長(zhǎng)序列任務(wù)會(huì)存在“信息丟失”問(wèn)題,串行模式導(dǎo)致訓(xùn)練效率低下。

為適應(yīng)輸入序列和輸出序列不等長(zhǎng)的任務(wù)需求,序列對(duì)序列模型Seq2Seq應(yīng)運(yùn)而生。如字面意思,這種結(jié)構(gòu)最重要的地方在于輸入序列和輸出序列的長(zhǎng)度是可變的,如輸入序列長(zhǎng)度為3(“早上好”),輸出序列長(zhǎng)度為2(“Good Morning”)。不過(guò),Seq2Seq仍然存在中間向量C的長(zhǎng)度固定和串行模式兩個(gè)缺陷。

直到2017年,谷歌發(fā)表“Attention is All You Need”的論文,提出將“Attention”(注意力機(jī)制)應(yīng)用到Seq2Seq中,形成一種新的算法框架“Transformer”(變換器),不再將整個(gè)輸入序列編碼為固定長(zhǎng)度的中間向量C,而是編碼成一個(gè)向量的序列(向量C1,向量C2,……,向量Cn),同時(shí)采用于并行模式取代串行模式,從而改進(jìn)了“信息丟失”和“效率低下”這兩個(gè)缺陷,參見下圖4。

圖4 注意力機(jī)制原理示意圖

從此,Transformer作為一種新的編碼器-解碼器通用算法框架驅(qū)動(dòng)著各種預(yù)訓(xùn)練大模型如雨后春筍般涌現(xiàn),如下圖5所示。ChatGPT也由此而來(lái)。

圖5 基于Transformer的各種預(yù)訓(xùn)練大模型

04?新模式:預(yù)訓(xùn)練大模型

人工智能包括三要素:數(shù)據(jù)、算法和算力,三者的共同作用驅(qū)動(dòng)了人工智能算法模型的開發(fā)與應(yīng)用。整體上看,人工智能算法模型的開發(fā)模式可分為兩個(gè)階段。第一階段是針對(duì)特定任務(wù)的“小模型”階段。2017年,Transformer的出現(xiàn),驅(qū)動(dòng)著人工智能算法模型進(jìn)入預(yù)訓(xùn)練“大模型”階段。

所謂“小模型”,是指模型構(gòu)建時(shí)往往針對(duì)一個(gè)特定任務(wù),用于訓(xùn)練的數(shù)據(jù)量和模型的參數(shù)量相對(duì)較少,解決任務(wù)的能力往往囿于特定任務(wù)場(chǎng)景,而對(duì)于不同場(chǎng)景的同類任務(wù)的泛化應(yīng)用能力相對(duì)較弱,即復(fù)用性較差。同時(shí),由于每一次模型的開發(fā)都涉及數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、模型部署、數(shù)據(jù)更新、模型調(diào)優(yōu)等全流程環(huán)節(jié),因此,開發(fā)效率低,開發(fā)和運(yùn)維成本高。

而預(yù)訓(xùn)練“大模型”,是指最開始時(shí)并不針對(duì)某一個(gè)特定任務(wù),而是在更為廣泛的通用原始數(shù)據(jù)(無(wú)需進(jìn)行人工標(biāo)注)上進(jìn)行無(wú)監(jiān)督學(xué)習(xí),得到一個(gè)通用基礎(chǔ)模型。應(yīng)用過(guò)程中,再針對(duì)特定任務(wù),通過(guò)適當(dāng)少量的人工標(biāo)注數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí),即微調(diào),以得到解決特定任務(wù)的算法模型。同時(shí),通過(guò)各類任務(wù)的應(yīng)用反饋再迭代升級(jí)基礎(chǔ)通用模型,進(jìn)一步增強(qiáng)模型的魯棒性和泛化應(yīng)用能力。如下圖6所示。附6 預(yù)訓(xùn)練大模型+微調(diào)示意圖

相比小模型,預(yù)訓(xùn)練大模型有助于用工程化、通用化思維開發(fā)算法模型,從而極大地提高了人工智能算法模型的開發(fā)效率。不同于小模型的碎片化,大模型各特定任務(wù)之間可通過(guò)基礎(chǔ)通用模型進(jìn)行連接。同時(shí),預(yù)訓(xùn)練大模型的開發(fā)、部署和維護(hù)成本要低得多。

預(yù)訓(xùn)練大模型的發(fā)展趨勢(shì)主要在三個(gè)維度:數(shù)據(jù)量越來(lái)越大(從GB級(jí)向TB級(jí)躍遷、從結(jié)構(gòu)化數(shù)據(jù)為向結(jié)構(gòu)化和非結(jié)構(gòu)化多源數(shù)據(jù)為主轉(zhuǎn)變)、模型參數(shù)越來(lái)越多(千億級(jí)和萬(wàn)億級(jí))、從單任務(wù)單模態(tài)(或文本或圖像或音頻或視頻)向多任務(wù)多模態(tài)(文本、圖像、音頻和視頻)轉(zhuǎn)變。

ChatGPT是基于GPT-3.5這個(gè)預(yù)訓(xùn)練大模型并結(jié)合“從人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)”(RLHF)方法進(jìn)行微調(diào)而來(lái)。根據(jù)公開資料報(bào)道,ChatGPT的模型參數(shù)量達(dá)到1750億,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到45TB。訓(xùn)練素材來(lái)自2/3的互聯(lián)網(wǎng)內(nèi)容,包括維基百科的600多萬(wàn)篇文章和世界幾個(gè)大博物館的所有藏書。這些素材包含了人類幾千年來(lái)所積攢的絕大部分知識(shí),以此為基礎(chǔ),ChatGPT成功地構(gòu)建起了強(qiáng)大的知識(shí)體系。也正因此,它逐步開始能夠勝任各種人類工作。

預(yù)訓(xùn)練大模型的出現(xiàn),將重塑人工智能算法生態(tài)鏈。基礎(chǔ)設(shè)施即人工智能計(jì)算中心(也稱“智算中心”)、預(yù)訓(xùn)練大模型和算法API調(diào)用與應(yīng)用開發(fā)將成為新的人工智能算法生態(tài)鏈中極為重要的三個(gè)層面。以國(guó)內(nèi)為例,目前,作為基礎(chǔ)設(shè)施層的智算中心建設(shè)正在各地如火如荼地開展;預(yù)訓(xùn)練大模型方面,以阿里(M6大模型)、華為(盤古大模型)、百度(文心大模型)和騰訊(混元大模型)為代表的國(guó)內(nèi)眾多企業(yè)都在紛紛入局;而調(diào)用接口APT進(jìn)行應(yīng)用開發(fā)將有助于促進(jìn)許多中小企業(yè)、初創(chuàng)公司快速展開垂直行業(yè)應(yīng)用。新的人工智能算法生態(tài)鏈將加速推進(jìn)人工智能算法的產(chǎn)業(yè)化進(jìn)程。

05?新變革:AIGC將成為新的內(nèi)容生產(chǎn)者

如前文所述,ChatGPT具有寫詩(shī)、作詞、撰文、寫作報(bào)告、總結(jié)摘要、設(shè)計(jì)提綱,甚至包括撰寫軟件代碼等能力。通過(guò)對(duì)人類“提示”的理解,可以生成用戶想要的“文字”材料,即“文本生成文本”。

無(wú)獨(dú)有偶,“文本生成圖像”也是過(guò)去一年人工智能領(lǐng)域一個(gè)現(xiàn)象級(jí)的技術(shù)創(chuàng)新與應(yīng)用。其標(biāo)志性事件是2022年8月份,一幅基于人工智能軟件平臺(tái)Midjourney生成的“太空歌劇院”的AI繪畫榮獲美國(guó)科羅拉多州藝術(shù)博覽會(huì)頭獎(jiǎng)。另外,谷歌公司的“文本生成音頻”產(chǎn)品MusicLM也正在粉墨登場(chǎng)。而在“文本生成視頻”方面,谷歌的Phenaki和Imagen Video、Meta的Make-A-Video、百度的智能視頻合成平臺(tái)VidPress等文生視頻模型都在紛紛走向臺(tái)前。

最為震撼的當(dāng)屬谷歌旗下的DeepMind公司的人工智能產(chǎn)品AlphaFold,它能通過(guò)內(nèi)容生成預(yù)測(cè)并繪畫蛋白質(zhì)的折疊結(jié)構(gòu)。也因如此,“人工智能內(nèi)容生成”AIGC被《科學(xué)》雜志評(píng)為2022年十大技術(shù)突破之一。

人類文明發(fā)展史,實(shí)際上是一部知識(shí)內(nèi)容生成不斷發(fā)展的歷史。自1946年第一臺(tái)電子管計(jì)算機(jī)的問(wèn)世,到1958年第一臺(tái)晶體管計(jì)算機(jī)的誕生,再到后來(lái)大規(guī)模和超大規(guī)模集成電路的出現(xiàn),計(jì)算技術(shù)一直在摩爾定律的驅(qū)動(dòng)下,促進(jìn)人類知識(shí)內(nèi)容生成的指數(shù)級(jí)增長(zhǎng)。歷經(jīng)PC互聯(lián)和移動(dòng)互聯(lián),當(dāng)今正進(jìn)入萬(wàn)物互聯(lián)時(shí)代,人類知識(shí)內(nèi)容的生成與增長(zhǎng)進(jìn)入了一個(gè)前所未有的新階段。數(shù)據(jù)攜帶信息,信息蘊(yùn)含知識(shí)。據(jù)公開資料報(bào)道,從2016年至2020年五年的時(shí)間,全球數(shù)據(jù)增長(zhǎng)量將比過(guò)去幾千年人類所積累的數(shù)據(jù)的總和還要多。

從內(nèi)容生成的發(fā)展階段來(lái)看:可以劃分為專家生成內(nèi)容(如電視、電影和游戲等)、用戶生成內(nèi)容(如微信微博、開源社區(qū)、短視頻等)、AI 輔助生產(chǎn)內(nèi)容及 AI 生成內(nèi)容。其中,PGC 模式下,內(nèi)容生產(chǎn)和變現(xiàn)的權(quán)力掌握在少數(shù)人手中,集中程度更高,因此PGC 難以滿足大規(guī)模的內(nèi)容生產(chǎn)需求,即存在產(chǎn)能限制;而UGC模式由于生產(chǎn)者可為用戶本身,因此突破了產(chǎn)能限制,但由于生產(chǎn)門檻相對(duì)較低,個(gè)性化和多樣化需求繁榮,因此難以保證內(nèi)容質(zhì)量;而 AIGC 不僅可突破可PGC模式的產(chǎn)能瓶頸,也可兼顧內(nèi)容質(zhì)量的提升,特別是AIGC在圖像和音視頻方面的生成能力,將有助力于Web3.0游戲充分滿足游戲參與者在場(chǎng)景和人物構(gòu)建方面的個(gè)性化高質(zhì)量需求。

作為知識(shí)內(nèi)容生成發(fā)展過(guò)程中的新一輪范式轉(zhuǎn)移,AIGC將帶來(lái)以下幾個(gè)方面的變革。

第一是數(shù)據(jù)增長(zhǎng)。基于AIGC技術(shù)的合成數(shù)據(jù)迎來(lái)重大發(fā)展,合成數(shù)據(jù)將牽引人工智能的未來(lái)。Gartner預(yù)計(jì)到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%,到2030年合成數(shù)據(jù)將徹底取代真實(shí)數(shù)據(jù)。MIT科技評(píng)論將AI合成數(shù)據(jù)列為2022年十大突破性技術(shù)之一。合成數(shù)據(jù)的用途是成為真實(shí)世界數(shù)據(jù)的廉價(jià)替代品,用來(lái)訓(xùn)練、測(cè)試、驗(yàn)證AI模型,成為訓(xùn)練AI的主要數(shù)據(jù)來(lái)源。

第二是知識(shí)拓展。智能時(shí)代,AIGC將快速拓展人類對(duì)自然世界的認(rèn)知,AlphaFold通過(guò)內(nèi)容生成預(yù)測(cè)并繪畫蛋白質(zhì)的折疊結(jié)構(gòu)便是例證。

第三是信息獲取方式的改變。AIGC不僅改變創(chuàng)作,還將改變獲取信息的主要方式。以ChatGPT為例,在尋找答案、解決問(wèn)題的效率上,ChatGPT直接給出搜索結(jié)果,而現(xiàn)今的搜索引擎只能給出隱藏結(jié)果的網(wǎng)頁(yè)列表。

第四是直接提高生產(chǎn)力。生成式AI可以嵌入生產(chǎn)和工作環(huán)節(jié),與工作流程相結(jié)合,直接提高生產(chǎn)效率、降低生產(chǎn)成本,促進(jìn)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型。微軟CEO薩蒂亞·納德拉(Satya Nadella)在做客《華爾街日?qǐng)?bào)》訪談時(shí)說(shuō):“……事實(shí)上,ChatGPT可以用來(lái)建立工作流程。這意味著零售、倉(cāng)庫(kù)、醫(yī)療保健等一線工人,他們不是IT專家,他們?cè)谟?jì)算機(jī)科學(xué)方面也不熟練,但實(shí)際上,他們可以參與到組織的數(shù)字化轉(zhuǎn)型工作中來(lái)……,而且還可以參與到知識(shí)工作中來(lái)”。AIGC有望成為數(shù)字經(jīng)濟(jì)時(shí)代驅(qū)動(dòng)需求爆發(fā)的殺手級(jí)應(yīng)用。

第五是加速“經(jīng)濟(jì)奇點(diǎn)”的到來(lái)。“經(jīng)濟(jì)奇點(diǎn)”是人工智能專家(英)卡魯姆·蔡斯(Calum Chace)創(chuàng)造的一個(gè)詞,即AI技術(shù)本質(zhì)上會(huì)造成社會(huì)的大規(guī)模失業(yè)。

第六是極大地降低經(jīng)濟(jì)社會(huì)成本。AIGC模型的通用化水平和工業(yè)化能力的持續(xù)提升將引起經(jīng)濟(jì)社會(huì)成本結(jié)構(gòu)的重大改變。OpenAI公司創(chuàng)始人兼首席執(zhí)行官山姆·阿爾特曼(Sam Altman)在他的“Moore"s law for everything”(即萬(wàn)物摩爾定律)一文中預(yù)測(cè):人類社會(huì)需要的商品和服務(wù),將會(huì)大規(guī)模地由AI來(lái)生產(chǎn),這會(huì)導(dǎo)致商品和服務(wù)的價(jià)格下降,由于AI的大規(guī)模普及,房子、汽車、日常商品和服務(wù)的價(jià)格,每幾年就會(huì)降低一半。

ChatGPT是在海量數(shù)據(jù)、超大模型和巨大算力的工程性結(jié)合下,通過(guò)對(duì)海量數(shù)據(jù)中單詞-單詞、句子-句子等之間的關(guān)聯(lián)性概率預(yù)測(cè),才體現(xiàn)出強(qiáng)大的語(yǔ)言對(duì)話能力。無(wú)疑,ChatGPT無(wú)法避免帶有惡意和偏見的錯(cuò)誤數(shù)據(jù)對(duì)知識(shí)生成結(jié)果的干擾。但隨著法律和倫理規(guī)制的不斷強(qiáng)化以及模型的迭代升級(jí),再加上不斷增強(qiáng)的自學(xué)習(xí)和推理能力,人類離通用人工智能AGI時(shí)代將越來(lái)越近。ChatGPT已經(jīng)打開了通用人工智能AGI時(shí)代。

關(guān)鍵詞:

專題首頁(yè)|財(cái)金網(wǎng)首頁(yè)

投資
探索

精彩
互動(dòng)

獨(dú)家
觀察

京ICP備2021034106號(hào)-38   營(yíng)業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com 關(guān)于我們 財(cái)金網(wǎng)  版權(quán)所有  cfenews.com