ChatGPT是一款人工智能聊天機器人,在今年1月份的月活躍用戶預(yù)計已達到1億。
(資料圖片)
ChatGPT由人工智能研究公司OpenAI在2022年11月30日上線,其功能包括了信息查詢、日常聊天、撰寫文章、編寫程序甚至賦詩作詞等人們?nèi)粘9ぷ魃钕嚓P(guān)的方方面面。
2023年在實現(xiàn)商業(yè)化落地后,A股市場ChatGPT、AIGC概念股持續(xù)走熱,賽為智能、海天瑞聲、云從科技、初靈信息、漢王科技等概念股領(lǐng)漲,上周漲幅均超過60%。
ChatGPT是什么?從何而來
簡單來說,ChatGPT是一個智能聊天機器人,通過使用Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)理解和生成文本,模擬人類對話。
你打開ChatGPT的對話框,輸入“請寫一部關(guān)于XX的小說”,幾分鐘后,你就能收獲一篇結(jié)構(gòu)完整的短篇小說。
ChatGPT的神奇之處,在于它做到了幾乎能和人類無差別的場景交流。
它可以輕松撰寫文案、代碼,涉及歷史、文化、科技等諸多領(lǐng)域,甚至還能寫詩、求醫(yī)問藥、改bug、編代碼、寫論文、寫歌詞。
去年有報道稱,ChatGPT通過了谷歌編碼三級工程師面試,年薪18.3萬美元,這相對人類來說,簡直可以稱之為“無所不能,什么都懂”。
因此,2023年春節(jié)剛過,ChatGPT就引爆了人工智能領(lǐng)域。
一經(jīng)亮相,便成“王者”。
ChatGPT的出現(xiàn),引發(fā)全民追捧AI科技。
研究顯示,ChatGPT推出短短五天時間,注冊用戶數(shù)就超過了100萬,目前這一數(shù)據(jù)已經(jīng)突破了1億。
過億用戶的盛情追捧,離不開科技巨頭微軟、Meta以及亞馬遜AWS等公司的高強度關(guān)注。
在ChatGPT母公司OpenAI成立的七年來,微軟為其注資10億美元并調(diào)動大量研發(fā)力量。日前,微軟宣布向OpenAI追加投資數(shù)十億美元,并打算將其AI工具整合在微軟的Bing搜索以及多項產(chǎn)品當(dāng)中。同時,Meta也表示將向OpenAI支付數(shù)百萬美元,幫助ChatGPT為Facebook等旗下產(chǎn)品生成創(chuàng)作者內(nèi)容。
與此同時,谷歌對于ChatGPT可能帶來的改變表示關(guān)注。
谷歌母公司Alphabet CEO桑達爾·皮查伊表示谷歌將在“未來幾周或幾個月”推出類似ChatGPT、基于人工智能的大型語言模型。
同時有消息稱,百度將在2023年3月推出和ChatGPT類似的人工智能聊天機器人服務(wù),其最初版本將內(nèi)嵌在其搜索服務(wù)當(dāng)中。
ChatGPT為何火速躥紅?背后的核心技術(shù)原理是什么
ChatGPT靠仿真聊天和回答出圈,躥火的一方面還在于美國89%的大學(xué)生都用ChatGPT來做作業(yè),各國投顧圈用ChatGPT能一分鐘直接生成投研報告,科技界都開始關(guān)注ChatGPT背后的核心技術(shù),甚至在ChatGPT還在普及階段,斯坦福大學(xué)就已經(jīng)研究了反AI的全新算法,制止學(xué)生用AI生成文本的DetectGPT。
伴隨著ChatGPT火爆的ChatGPT概念股,在A股這幾天也紛紛跟紅。
虧損的AI龍頭,股價6天翻倍。
愈演愈烈的ChatGPT概念,使得這在國內(nèi)看起來不像是一場全球人工智能領(lǐng)域難得的突破性事件,而更像一場資本追逐概念股的狂歡。
一個ChatGPT應(yīng)用的走紅,A股是人工智能和不是人工智能的公司好像都瞬間獲益了。
偽AI公司股價也已翻倍。
但獲益的背后,也只是純粹的市場概念炒作的結(jié)果,并非來自真正國內(nèi)AI技術(shù)的突破和創(chuàng)新。
而說到ChatGPT背后的核心技術(shù),緣起自然語言處理領(lǐng)域的一篇科研論文《Attention is all your need》中名為transformer的算法。
transformer算法自誕生之日起,就被廣泛應(yīng)用于AI領(lǐng)域,成為了近幾年最熱門的AI算法模型。
AI技術(shù)數(shù)十年間從transformer算法到GPT(Generative Pre-Training),再到GPT2的迭代標志Open AI,以及GPT3和ChatGPT的“出圈”,未來很長一段時間,人類將迎來“科研、算力、基礎(chǔ)架構(gòu)、工程、數(shù)據(jù)、解決方案”循環(huán)的快速迭代。
transformer算法的核心內(nèi)容是并行計算。
Transformer模型示意圖
自然語言處理主要的算法叫RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))算法,其弊病是需要大量的串行計算,效率低。
而在Transformer算法里,作者將每個字與句子中所有單詞進行計算,算出這個詞與每個單詞的相關(guān)度,從而確定這個詞在這個句子里的更準確意義。
同時,機器學(xué)習(xí)領(lǐng)域最核心的一個概念——“向量”,誕生了。
在數(shù)字化時代,數(shù)學(xué)運算最小單位往往是自然數(shù)字。
但在AI時代,這個最小單元變成了向量。這是數(shù)字化時代計算和智能化時代最重要的差別之一。
向量是一組數(shù)據(jù)的集合,也可以想象成在一個超高維度空間里的一個點。
這種方法,可以在一個超長句子中發(fā)揮優(yōu)勢,而且最關(guān)鍵的是一舉突破了時序序列的屏障,以前對于圖像和NLP算法的劃分,很大程度上是由于NLP有很明顯的時序特征,即每個單詞和下一個以及在下一個有比較明顯的時序關(guān)系。
計算過程在于將attention數(shù)值就是除了“我”字自有信息和位置信息以外,成功得到這個句子中每個單詞的相關(guān)度信息。
這是理論科研、算法、架構(gòu)、工程的角度上,真正意義的進步。
ChatGPT到底可以關(guān)聯(lián)多少行業(yè)?
公關(guān),健身,金融,學(xué)術(shù),數(shù)字營銷
計算機,管理,體育,醫(yī)美,自動駕駛
ChatGPT的火已經(jīng)燒到了許多不同的行業(yè)。
程序員行業(yè),ChatGPT拿下了谷歌120萬年薪offer,可以做谷歌三級程序員。
金融行業(yè),財通證券李躍博團隊采用ChatGPT撰寫了一篇醫(yī)美行業(yè)研究報告《ChatGPT實測:提高外在美,增強內(nèi)在自信——醫(yī)療美容革命》。
ChatGPT擁有強大的的語言理解能力,可廣泛應(yīng)用于多種對話問答場景,包括智能客服、虛擬人、機器人、游戲 NPC 等應(yīng)用領(lǐng)域。
文娛傳播行業(yè),在ChatGPT輸入你想要的文本要求,它一分鐘就能生成小說,詩歌,企業(yè)年報,財報,金融研報,危機公關(guān)方案,健身計劃,學(xué)術(shù)論文,高中作業(yè),數(shù)字營銷方案,計算機程序語言,醫(yī)美方案,體育方案等等。
互聯(lián)網(wǎng)行業(yè),和目前的搜索引擎以及知乎等平臺相比,ChatGPT給出的答案比較系統(tǒng)、全面,而且非常及時。
另外還有一些日常的文字處理工作,比如就某個主題寫一個提綱或者起草一個方案,ChatGPT幾秒鐘就可以給出結(jié)果。
AI技術(shù)在2017年就曾寫出過唯美詩歌集:“孤陳的城市在長夜中埋葬/他們記憶著最美麗的皇后/飄零在西落的太陽下/要先做一場夢……”(微軟小冰《陽光失了玻璃窗》)
甚至,ChatGPT還能回答專業(yè)度較高的問題,充當(dāng)AI在線知乎,以及創(chuàng)作小說大綱(仿《流浪地球》)。
AI繪畫作品出圈、一級投資活躍,2022年AIGC爆發(fā)式發(fā)展。
AI作詞、作曲、編曲等,具體包括由旋律生成歌詞、由歌詞生成旋律、不同曲風(fēng)旋律生成、和弦生成、音樂續(xù)寫等,可應(yīng)用于音樂欣賞、游戲音效、實體場景配樂等多個領(lǐng)域。
使用AI對視頻進行編輯,包括刪除視頻特定主體、自動跟蹤剪輯、視頻特效生成、自動添加特定內(nèi)容、視頻美顏等,大大降低了視頻編輯的專業(yè)門檻,提升了視頻剪輯效率,目前已廣泛應(yīng)用于視頻創(chuàng)作領(lǐng)域,具體應(yīng)用包括剪映、百度智能創(chuàng)作平臺、抖音、美圖等。
ChatGPT 在學(xué)術(shù)、房產(chǎn)等領(lǐng)域的應(yīng)用逐漸落地。除了各大科技公司,ChatGPT也開始應(yīng)用于學(xué)術(shù)、房產(chǎn)等領(lǐng)域。
美國房產(chǎn)中介也開始使用 ChatGPT,用于房源信息撰寫、房貸計算等。
中國傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院副教授王小寧在接受《環(huán)球時報》采訪時談道,“ChatGPT的出現(xiàn)是一種機遇和挑戰(zhàn)的結(jié)合,在發(fā)揮它優(yōu)勢的同時,也應(yīng)該認真對待它可能帶來的問題。”
ChatGPT時代,人類會逐步失業(yè)嗎?
最近ChatGPT的再次出圈,讓許多人又開始探討和研究AIGC。
這樣的氛圍確實很好,不過人類可能也需要對AI抱有更多的理智。
一方面,AI還有很多缺陷。
比如ChatGPT作為語言模型,是一個極度偏科的“文科生”。
粗略來說,它可以通過極大的文本訓(xùn)練量把話說得人模人樣,但卻很難“長腦子”,也就是通過自己的邏輯思考來得出結(jié)果。
最主要的問題之一就是聊天機器人和文本生成工具無法判斷內(nèi)容的質(zhì)量和好壞,可以學(xué)習(xí)網(wǎng)絡(luò)上所有文本,可能產(chǎn)生惡意的甚至攻擊性的語言輸出。
另一方面,ChatGPT的記憶力有限。
雖然ChatGPT能夠記住用戶說過的話,但ChatGPT目前也只能從當(dāng)前會話中引用最多約3000個單詞,因為超出此范圍的任何用戶信息都不會被保存。
ChatGPT暫時還無法勝任人類營養(yǎng)師及健身教練的工作,因為這些工作涉及用戶隱私、數(shù)據(jù)保存以及個性化推薦等。
如果ChatGPT算對了一個簡單的加法,很可能是因為網(wǎng)上就這么說的,而不是它真的會算。
在對海量文本數(shù)據(jù)集的學(xué)習(xí)之上,ChatGPT形成的預(yù)測和關(guān)聯(lián)知識,其實質(zhì)是將人類已有的群體知識連接在一起的自動化媒介。
ChatGPT這類基于人類群體知識和記憶的知識生產(chǎn)方式,總體而言還是“人工”帶來的智能,它的成就必然與既有的主要基于個體知識與記憶的知識生產(chǎn)方式產(chǎn)生沖突。
因此,在ChatGPT后時代,不少行業(yè)的從業(yè)人員工作會受到適量沖擊。
但也像谷歌,微軟等科技巨頭和金融界大佬所分析的,ChatGPT只能從事基礎(chǔ)程序員工作,更高級的工作需要更多學(xué)習(xí),迭代后有望出現(xiàn)機會,但目前很多金融和科技類工作分析還是富含個性化思維,目前ChatGPT還很難建立自己的邏輯,并非《流浪地球》里的智能量子計算機Moss。
據(jù)投資公司 Radical Ventures 預(yù)測,GPT-4 或采用更大規(guī)模的數(shù)據(jù)集,可能在10 萬億個 token 的數(shù)據(jù)集上進行訓(xùn)練,同時它的參數(shù)有望比 Megatron-Turing 的要少。GPT-4 有可能是多模態(tài)的,支持文本、圖片、視頻等多種數(shù)據(jù)類型的輸入。意味著 GPT-4 可以根據(jù)文本提示詞(prompt)生成圖像,或者是可以輸入視頻然后通過文本的形式回答問題。
但就目前而言,ChatGPT目前的成功主要是技術(shù)上的,我們在擁抱其帶來的機遇的同時,也應(yīng)當(dāng)看到ChatGPT的漏洞。
比如,一,在各專業(yè)領(lǐng)域的運用,還需要進行各專業(yè)領(lǐng)域的特殊訓(xùn)練和模式適應(yīng)。
如金融行業(yè),人工智能算法可以生成研報,在投研領(lǐng)域,ChatGPT主要應(yīng)用的大規(guī)模預(yù)訓(xùn)練語言模型技術(shù)已被廣泛投入使用。
但是當(dāng)其引入垂直金融領(lǐng)域落地時,其預(yù)訓(xùn)練環(huán)節(jié)還需要調(diào)整。
一方面需要做加法,用金融領(lǐng)域的私有、專有數(shù)據(jù)對其進行增強樣本的訓(xùn)練,補足通用模型在金融領(lǐng)域的短板;另一方面需要做減法,將超大模型中金融領(lǐng)域用不到的資源摘除。
不過以上的深入,也涉及到了金融行業(yè)的隱秘性信息安全等問題。
二,在ChatGPT 風(fēng)口已至,商業(yè)化落地加速的同時,ChatGPT面臨的潛在法律風(fēng)險卻也大幅上升。
ChatGPT其僅僅是Transformer和GPT等自然語言處理技術(shù)的集成,本質(zhì)上依然是一個基于神經(jīng)網(wǎng)絡(luò)的語言模型,按計算機專業(yè)人士行話評價,依然還是“人工”智能。
人工兩個字就很巧妙,AI與法律的邊界也在于使用人工的不同人類與法律的邊界關(guān)系。
據(jù)新聞報道,ChatGPT技術(shù)也被黑客拿來利用,作為其破壞行為升級的“新武器”。
黑莓(Black Berry)的一份報告調(diào)查了英國500名IT行業(yè)決策者對ChatGPT這項革命性技術(shù)的看法,發(fā)現(xiàn)超過四分之三(76%)的人認為,外國已經(jīng)在針對其他國家的網(wǎng)絡(luò)戰(zhàn)爭中使用ChatGPT。
近一半(48%)的人認為,2023年,將會出現(xiàn)有人惡意使用ChatGPT而造成“成功”的網(wǎng)絡(luò)攻擊,譬如網(wǎng)絡(luò)罪犯使用人工智能聊天機器人來偽造可信的網(wǎng)絡(luò)釣魚郵件(57%),提高攻擊的復(fù)雜性(51%),并加速新的社交網(wǎng)絡(luò)攻擊(49%)。
蘋果手機用戶就經(jīng)常吐槽,自己的手機下載了國家反詐中心也防不勝防,各種釣魚網(wǎng)站短信走cloud紛飛,一不留神就是點擊進了一個社交網(wǎng)絡(luò)攻擊的陷阱。
目前,中國尚無國家層面的人工智能產(chǎn)業(yè)立法,人工智能在中國整體監(jiān)管仍有待完善。
同時,ChatGPT帶來的虛假信息存在法律風(fēng)險問題。另外,AI技術(shù)廣泛應(yīng)用還伴隨著知識產(chǎn)權(quán)的合規(guī)問題。
三,雖然生成式 AI 賽道火熱,資金扎堆涌入,但是國外頭部機構(gòu)引領(lǐng)技術(shù)和商業(yè)應(yīng)用,國內(nèi)整體進度落后 2到3 年。
技術(shù)發(fā)展可能存在不及預(yù)期的風(fēng)險,且當(dāng)前 AIGC 技術(shù)仍有局限。
新的技術(shù)需要商業(yè)化驗證目前 AIGC 的商業(yè)化仍處于早期探索階段,有存在不及預(yù)期風(fēng)險。
畢竟,不得不面對的殘酷現(xiàn)實是,國內(nèi)AI四小龍至今沒有一家實現(xiàn)盈利。
參考資料:
《從CHAT-GPT到生成式AI(Generative AI):人工智能新范式,重新定義生產(chǎn)力》中信建投證券《ChatGPT:又一個“人形機器人”主題》東吳證券《ChatGPT風(fēng)口已至,商業(yè)化落地加速》國聯(lián)證券《關(guān)注ChatGPT和代工龍頭在美建廠》華泰證券《體驗ChatGPT》真格基金等
關(guān)鍵詞: 自然語言處理 人工智能領(lǐng)域