從狂熱追捧到回歸冷靜,人們對大模型看法正在悄然發(fā)生轉(zhuǎn)變。一方面,由于合規(guī)、監(jiān)管等原因,通用大模型商業(yè)化尚需時(shí)日;另一方面,產(chǎn)業(yè)側(cè)才從金融、醫(yī)療等試點(diǎn)領(lǐng)域著手投入,效果上也并不能立竿見影。
(資料圖片)
于是,當(dāng)瘋轉(zhuǎn)的螺旋逐漸變慢,不同的聲音逐漸描繪出一個(gè)真實(shí)的“大模型”圖景。
這其中,究竟是上“通用大模型”,還是上“行業(yè)大模型”,各家也都在經(jīng)過一番考量后做出了選擇;而伴隨大模型之爭,“生成式AI”進(jìn)入聚光燈下。不得不說,ChatGPT無異于是人工智能行業(yè)發(fā)展進(jìn)入新階段的一針強(qiáng)心劑,它將AI重新推向了時(shí)代中心。
通用大模型與行業(yè)大模型之爭
ChatGPT讓業(yè)界認(rèn)識到了通用大模型的巨大能量,這才有了后面“百模大戰(zhàn)”的商界奇觀,無數(shù)投資人、創(chuàng)業(yè)者為此夜不能寐,GPU資源也一時(shí)變得“洛陽紙貴”。
這其中,不乏一些行業(yè)頭部的技術(shù)公司被逼上“梁山”。一位大模型業(yè)內(nèi)人士就曾對鈦媒體App透露其公司所處現(xiàn)狀:“沒有大模型都不好意思出來講,現(xiàn)在做吧,趕了個(gè)晚集,說沒有又不好交代?!彼运麄冎荒芤贿厡ν饨绶懦稣谧鐾ㄓ么竽P偷南?,一邊內(nèi)部加緊研發(fā)進(jìn)度。
但通用大模型畢竟是一件費(fèi)時(shí)費(fèi)力的苦差事,OpenAI將GPT1.0迭代到4.0用了6年,百度文心一言、智源悟道等業(yè)界反饋較好的通用大模型也都是從幾年前就開始著手訓(xùn)練。因此如果在AI技術(shù)和數(shù)據(jù)等方面沒有基礎(chǔ)積累,想要在短期內(nèi)實(shí)現(xiàn)通用大模型的商業(yè)化是非常困難的一件事。
再加上通用大模型天然需要公開數(shù)據(jù)做訓(xùn)練,把自身數(shù)據(jù)投入通用大模型也意味著默認(rèn)將數(shù)據(jù)共享。所以,一些對數(shù)據(jù)隱私要求高的行業(yè),也不太可能在毫無準(zhǔn)備的情況下接入通用大模型。
在這一境況下,行業(yè)大模型成為業(yè)界在通用大模型之外,“退而求其次”且能較快享有大模型紅利的方案。360集團(tuán)創(chuàng)始人周鴻祎也曾直言:“人工智能大模型未來機(jī)會在企業(yè)級增量市場,大模型是‘垂直化’是發(fā)展方向?!蹦炒髲S技術(shù)高管也對鈦媒體App表示。“從我們在大模型的規(guī)劃上來看,持續(xù)迭代通用大模型,并以此繼續(xù)分層,進(jìn)行行業(yè)垂直大模型訓(xùn)練?!?/p>
不久前,在2023 世界人工智能大會上,騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生也表示,企業(yè)的大模型應(yīng)用需要綜合考慮行業(yè)專業(yè)性、數(shù)據(jù)安全、持續(xù)迭代和綜合成本等因素?;谛袠I(yè)大模型,構(gòu)建自己的專屬模型,也許是企業(yè)更優(yōu)的選項(xiàng)。原因是,行業(yè)大模型所需參數(shù)比通用大模型少,訓(xùn)練和推理的成本更低,模型優(yōu)化也更容易。
不過,鈦媒體App也從以為行業(yè)人士處獲悉,在一些情況下,通用大模型也不是垂直大模型的必要條件,也就說一家訓(xùn)練行業(yè)大模型的平臺不必須以通用大模型為底座。“如果定義的通用大模型是千億參數(shù)那種,那么通用大模型不是行業(yè)大模型的必要條件?!痹谝淮谓涣髦校晃恍袠I(yè)大模型高管向鈦媒體App表示。不過,他也表示,通用大模型雖然不是行業(yè)大模型的必要條件,但是訓(xùn)練通用大模型的各類底層技術(shù),如Transformer等,卻也是訓(xùn)練行業(yè)大模型必不可少的要素。
不動(dòng)輒“千億”參數(shù),“撇清”與通用大模型的關(guān)系,垂直大模型的門檻也進(jìn)一步降低,這給生成式AI的進(jìn)一步發(fā)展提供了更多可能性。
大模型之外,生成式AI也值得關(guān)注
每當(dāng)談及大模型,生成式AI(Generative Al)就會如影隨形。簡單來理解兩者的關(guān)系——大模型可以理解為實(shí)現(xiàn)生成式AI的引擎,即生成式 AI 的能力由機(jī)器學(xué)習(xí)模型或者大模型提供,而生成式AI比大模型更上層,生成式AI可以根據(jù)所需場景可以決定調(diào)用哪種大模型,ChatGPT是生成式AI的典型應(yīng)用之一。
早在2020年,生成式AI就入選了Gartner新興技術(shù)成熟度曲線,2022年,生成式AI被列入主要戰(zhàn)略技術(shù)趨勢之一,該技術(shù)已從創(chuàng)新觸發(fā)階段進(jìn)入膨脹期望的峰值。Gartner認(rèn)為生成式AI將成為一種通用技術(shù),其影響類似于蒸汽機(jī)、電力和互聯(lián)網(wǎng)。隨著生成式AI逐漸落地,圍繞這一概念的炒作將會逐漸消退,對人和企業(yè)在日常工作和生活中影響將會增加。
全球云計(jì)算巨頭亞馬遜云科技也是將筆墨更多地放在了生成式AI身上,亞馬遜云科技首席執(zhí)行官Adam Selipsky曾接受Bloomberg、CNBC等媒體專訪時(shí)表示:“生成式AI在聊天機(jī)器人和搜索上的應(yīng)用優(yōu)勢已經(jīng)有目共睹,但這只是眾多可能性的冰山一角。未來,生成式AI將為各行各業(yè)帶來變革?!彼焉墒紸I看做一次“突破性”變革,且有可能是自互聯(lián)網(wǎng)誕生以來最大的變革。
“想像一下,在計(jì)算機(jī)以穿孔卡片為交互界面的年代,只有少數(shù)科學(xué)家才有能力使用計(jì)算機(jī);當(dāng)圖形界面和鼠標(biāo)成為人機(jī)交互界面,人人都可以使用計(jì)算機(jī)?!盇dam Selipsky表示。
那么,生成式AI帶來的變革會體現(xiàn)在哪些方面呢?
可以看到,在汽車領(lǐng)域,已經(jīng)有企業(yè)使用生成式AI合成數(shù)據(jù)用于自動(dòng)駕駛訓(xùn)練,加快訓(xùn)練進(jìn)程;在制造領(lǐng)域,生成式AI可以幫助分析大量物聯(lián)網(wǎng)遙測數(shù)據(jù),進(jìn)行預(yù)測性維護(hù),減少生產(chǎn)線的停機(jī)時(shí)間。依托生成式AI,Autodesk與飛機(jī)制造商合作,成功完成了艙壁的部分設(shè)計(jì),并推出了重量減輕45%的新設(shè)計(jì)。如果將這種航壁推廣應(yīng)用到全球機(jī)隊(duì),將可以節(jié)省相當(dāng)于93000輛汽車油耗的燃油。
不過需要強(qiáng)調(diào)的是,Autodesk所依托的生成式AI背后并非是某某大模型,而是以機(jī)器學(xué)習(xí)模型構(gòu)建的AI驅(qū)動(dòng)的設(shè)計(jì)工具。
所以,對與生成式AI的實(shí)現(xiàn)來說,大模型只是一種選擇,未來也不會是以一個(gè)大模型為主導(dǎo)。鈦媒體App關(guān)注到,大多數(shù)企業(yè)在考慮接入大模型時(shí),并不僅僅直接入一家大模型,而是選擇接入多家。那么這多家大模型中,未來可能也不排除垂直大模型和通用大模型的通力合作。
以國內(nèi)兩款軟件用友和WPS為例,用友日前發(fā)布企業(yè)服務(wù)大模型YonGPT,據(jù)鈦媒體App了解,YonGPT規(guī)劃接入的通用大模型底座包含智譜ChatGLM、文心一言以及智源悟道天鷹等;WPS此前推出了WPS AI,據(jù)最新消息,WPS AI在中國內(nèi)地依托的通用大模型底座為MiniMax,其剛剛推出的海外版本則是由OpenAI和PaLM2提供大模型支持。
在生成式AI的世界中,不依賴一種大模型,而決定生成式AI是否成功的也并不只有大模型。
不可否認(rèn)的是,生成式AI的落地也多方面促成的結(jié)果,且圍繞生成式AI落地而出現(xiàn)的“次生”挑戰(zhàn)正在暴露出來。
生成式AI下“次生”挑戰(zhàn)
“對著手機(jī)說‘如果貓跑到沙發(fā)上,提醒我’,那么在貓跑到沙發(fā)上的時(shí)候,手機(jī)就會收到告警信息?!币曨l解決方案服務(wù)商山東中維世紀(jì)科技股份有限公司高級副總裁王正彬在一次演講中提到了智能家居的智能視頻檢測應(yīng)用場景。
但就是這樣一個(gè)看似簡單的場景,除了背后的多模態(tài)大模型,邊緣端的網(wǎng)絡(luò)、計(jì)算也非常重要?!跋馛hatGPT這樣的生成式AI應(yīng)用中,如果網(wǎng)絡(luò)丟包率達(dá)到1%的時(shí)候,大模型訓(xùn)練平臺的性能就會掉到它峰值性能的5%,也就是說95%都丟掉了。網(wǎng)絡(luò)能力對整個(gè)大模型平臺的性能是非常重要的因素?!庇⑻貭栔袊鴧^(qū)網(wǎng)絡(luò)與邊緣事業(yè)部首席技術(shù)官、英特爾高級首席 AI 工程師張宇說道。
有預(yù)測認(rèn)為,隨著AI需求的爆發(fā),人工智能的在邊緣端的部署,將會比在數(shù)據(jù)庫當(dāng)中高3倍,這也意味著邊緣端AI的落地是下一步人工智能發(fā)展的一大挑戰(zhàn)。
“人工智能部署到工廠產(chǎn)線等邊緣端的時(shí)間成本和人力成本還是偏高,且邊緣人工智能的部署超過一半都是失敗的?!庇⑻貭柟靖呒壐笨偛眉婢W(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理Sachin Katti 日前談到大模型時(shí)代下的邊緣計(jì)算問題時(shí)表示。原因一方面是設(shè)備陳舊,邊緣計(jì)算資源不足;另一方面,如何利用他們自身獨(dú)特的數(shù)據(jù)來部署 AI 也非常關(guān)鍵。很多邊緣 AI 的部署會因?yàn)檫@些挑戰(zhàn)止步不前。
同時(shí),生成式AI的更好表現(xiàn)最終也需要依靠數(shù)據(jù)來支撐,目前業(yè)界一方面希望能保證生成式AI中的數(shù)據(jù)安全,一方面也希望能夠?qū)崿F(xiàn)數(shù)據(jù)源能夠豐富可用。
這些問題的解決,也已經(jīng)在逐步推進(jìn)中?!敖裉斓拇竽P腕w系、AI體系是強(qiáng)依賴數(shù)據(jù)的,是數(shù)據(jù)驅(qū)動(dòng)的智能體系。這個(gè)體系對數(shù)據(jù)所需要的廣泛性和無偏差性要求非常高。假設(shè)數(shù)據(jù)偏差性非常大,很難有效支撐人工智能體系發(fā)展?!蔽浵伡瘓F(tuán)副總裁兼首席技術(shù)安全官韋韜曾表示,于是可以看到,目前已經(jīng)有反向驗(yàn)證AI數(shù)據(jù)安全的工具出現(xiàn)。
在開拓?cái)?shù)據(jù)源上,不久前,深圳數(shù)交所聯(lián)合近50家單位成立“開放算料聯(lián)盟”,共同發(fā)起機(jī)構(gòu)包括了騰訊云、華大基因、云天勵(lì)飛、奧比中光、優(yōu)必選、中國聯(lián)通廣東分公司、華傲數(shù)據(jù)等企業(yè),深圳市人工智能學(xué)會等協(xié)會,國家超級計(jì)算深圳中心等智庫及研究機(jī)構(gòu)。該算料聯(lián)盟成立的一個(gè)主要目的,就是圍繞高質(zhì)量中文訓(xùn)練數(shù)據(jù)和多模態(tài)訓(xùn)練數(shù)據(jù),協(xié)調(diào)數(shù)據(jù)要素、數(shù)據(jù)治理、訓(xùn)練數(shù)據(jù)、數(shù)據(jù)標(biāo)注、合成數(shù)據(jù)等相關(guān)標(biāo)準(zhǔn)制定,協(xié)助數(shù)據(jù)交易所增加大模型相關(guān)的新品類和新專區(qū)。
生成式AI在發(fā)展過程中所遭遇的挑戰(zhàn)并不能一文言盡,ChatGPT引發(fā)的全球AI風(fēng)暴也并不以ChatGPT而結(jié)束。在新人工智能世界被打開后,處于初級階段的大模型與生成式AI也暴露了諸多問題并拋出了一系列挑戰(zhàn),但同時(shí)這給各行各業(yè)提供了探索和創(chuàng)新的機(jī)會。
行業(yè)競逐生成式AI,這對人工智能甚至是人類的發(fā)展來說絕非是一件壞事。
(本文首發(fā)鈦媒體APP 作者 |秦聰慧)?
關(guān)鍵詞: