當前位置：科技 >

【全球聚看點】行業(yè)大模型，開卷！ | 鈦媒體深度

文章來源：鈦媒體APP　發(fā)布時間： 2023-07-01 10:27:02　責(zé)任編輯：cfenews.com

+|-

“文心一言看起來是匆忙上馬，我認為這個東西根本就不是為了賺錢，就是為了能趕ChatGPT熱潮，行業(yè)大模型才是真正能產(chǎn)生商業(yè)價值的東西?！卑俣任男囊谎园l(fā)布后不久，一位前百度員工對鈦媒體表示，“去年OpenAI沒這么火的時候，王老師（百度CTO王海峰）帶隊搞了10個大模型，就包括行業(yè)大模型，當時行業(yè)外關(guān)注不多，但如果現(xiàn)在看百度的布局，行業(yè)大模型其實是前瞻性布局，比OpenAI和微軟還早。”

【資料圖】

如今，通用大模型喧囂過后，行業(yè)模型正在逐漸占據(jù)聲量，也正印證這一現(xiàn)實：類似ChatGPT等基礎(chǔ)大模型賺的是“吆喝”，很大程度上是起到教育市場、塑造認知的作用，人工智能真正要落地、要賺到現(xiàn)在的錢，還要看行業(yè)大模型。

即便是海外市場，ChatGPT作為C端產(chǎn)品的部分屬性，熱度也已經(jīng)逐漸減弱——根據(jù)SimilarWeb數(shù)據(jù)，前期ChatGPT的訪問量增長率驚人，1月份的環(huán)比增長率為131.6%，2月份為62.5%，3月份為55.8%，在4月份明顯放緩，環(huán)比增長率為12.6%，到了5月，這個數(shù)字已經(jīng)變?yōu)榱?.8%，并預(yù)計6月的環(huán)比增長率有可能為負數(shù)。

“相信我們當中的很多人都試用過了ChatGPT，也相信很多人試用過之后，已經(jīng)將它放置一邊了，因為目前它和我們的工作基本上還是割裂的，所以用用就放下了。但我依然希望大家不要‘起個大早，趕了晚集’，因為這是一個會帶來顛覆性變革的范式革命?！蔽④洠ㄖ袊┕臼紫夹g(shù)官（CTO）韋青此前表示。

而基于ChatGPT或者大模型，打造的B端解決方案，正是解決大模型與場景割裂的良方。

國際上，微軟、亞馬遜等大廠也開始向企業(yè)級服務(wù)尋求商業(yè)化路徑，開始進行多個行業(yè)的探索；國內(nèi)，諸如百度、阿里、騰訊、華為都在快馬加鞭加速行業(yè)大模型投入。此外，很多全球范圍內(nèi)的行業(yè)龍頭和創(chuàng)業(yè)公司也正在探索行業(yè)大模型的前景，近日，北京市科委、中關(guān)村管委會也發(fā)布了北京市首批10個人工智能行業(yè)大模型應(yīng)用案例。此外，相關(guān)技術(shù)路線的企業(yè)并購金額也屢攀新高……

但大模型賽道還遠遠稱不上擁擠——伴隨技術(shù)迭代迎來飛躍式發(fā)展，各行各業(yè)正重新積累技術(shù)認知、塑造業(yè)務(wù)模式，一切才剛剛開始。

升級：千模大戰(zhàn)

如果說基礎(chǔ)模型是“百模大戰(zhàn)”，行業(yè)大模型就是“千模大戰(zhàn)”，就像樹干長出樹枝，每個基礎(chǔ)大模型廠商都可以孵化數(shù)個行業(yè)大模型，大廠們的行動默契而一致。

“雖然大家對通用大模型期待很高，但它不一定是滿足行業(yè)場景需求的最優(yōu)解?！?月19日，在騰訊云行業(yè)大模型發(fā)布會上，騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示。

在混元助手沒有對外發(fā)布的情況下，騰訊率先發(fā)布了行業(yè)大模型，依托騰訊云TI平臺打造的行業(yè)大模型精選商店，為客戶提供MaaS一站式服務(wù)，幫助企業(yè)客戶構(gòu)建專屬大模型及智能應(yīng)用。從騰訊處獲悉，有關(guān)C端的通用大模型，騰訊將在后續(xù)發(fā)布官方消息。

這一系列舉措或許可以理解為，暫且不論混元基礎(chǔ)大模型的效果和進展如何，優(yōu)先發(fā)布行業(yè)大模型，是在客戶急需的情況下，騰訊確保自身聲量、搶占市場客戶的必要之舉。

更早之前，華為云人工智能領(lǐng)域首席科學(xué)家田奇提到，華為把大模型分成三個層級，L0、L1、L2，L0就是大家所說的基礎(chǔ)通用模型，像GPT-3，在基礎(chǔ)模型L0的基礎(chǔ)上，加上行業(yè)數(shù)據(jù)，混合訓(xùn)練得到的行業(yè)大模型是L1。

然后再把L1針對具體下游千行百業(yè)的細分場景進行一些部署，得到細分場景的任務(wù)模型L2，為了盡快降低生產(chǎn)成本、提高效率，如何從行業(yè)大模型L1中快速生產(chǎn)L2模型，還有部署L2模型到端側(cè)、邊側(cè)和云側(cè)，這是非常重要的問題。

在7月即將舉辦的華為開發(fā)者大會的議程上可以看到，華為云將對盤古大模型如何從基礎(chǔ)大模型煉成行業(yè)大模型進行一系列的解讀和發(fā)布。

在今年的阿里云峰會上，阿里云CTO周靖人也表示，“今天不是所有的企業(yè)都需要從頭開始訓(xùn)練，也不需要大家從頭開始去做多種語料，包括大量的算力資源，從頭開始做大模型的一系列定制，我們希望今天通義千問模型之上，結(jié)合企業(yè)的場景、企業(yè)的知識體系、企業(yè)的行業(yè)特殊需求，產(chǎn)生一個個企業(yè)專屬模型。”

微軟也在做自己的行業(yè)大模型。4月份，在國內(nèi)，針對本土出海企業(yè)用戶，微軟Azure OpenAI Service國際版發(fā)布了首批三套面向零售電商、制造業(yè)和數(shù)字原生領(lǐng)域的Azure全球創(chuàng)新行業(yè)場景，集成GPT-3、GPT-4、Codex、DALL-E和企業(yè)級ChatGPT等五種大模型服務(wù)，幫助中國出海企業(yè)客戶加速拓展全球市場。

“千模大戰(zhàn)”一觸即發(fā)，但真正進入大浪淘沙的階段還為時尚早——整體來說，大模型還處于比較早期的發(fā)展階段，盡管行業(yè)大模型集中涌現(xiàn)，但這條賽道顯然有更大空間。

以金融行業(yè)大模型為例，其分成券商、保險、銀行、新金融等不同領(lǐng)域，每個領(lǐng)域的下游任務(wù)又分成幾十上百種的子任務(wù)。

“更重要的時刻，是接下來基于基礎(chǔ)模型，通過SFT等機制和構(gòu)建出能夠高效適配下游任務(wù)，并且在金融行業(yè)或者其他行業(yè)模型的下游任務(wù)產(chǎn)生規(guī)模效應(yīng)化的時候?！痹诎⒗锇桶瓦_摩院創(chuàng)新業(yè)務(wù)中心負責(zé)人陳海青看來，只是通過一些普適的非結(jié)構(gòu)化數(shù)據(jù)做繼續(xù)訓(xùn)練的行業(yè)大模型和場景，才算剛剛開始。

理智且現(xiàn)實的選擇

如果企業(yè)要做一個千億級參數(shù)的基礎(chǔ)大模型，需要單機群萬卡以上的算力，不僅要有GPU卡，還要把GPU的集群資源利用起來，大部分公司都無法做到。

而行業(yè)大模型顯然更容易實現(xiàn)，同時也兼具更廣闊的應(yīng)用前景。

“大模型賦能千行百業(yè)，但是對千行百業(yè)的場景要非常理解，不能指望訓(xùn)練出千億或者萬億大模型，企業(yè)用戶拿去就好用”，瀾舟科技創(chuàng)始人周明說?！皬耐ㄓ媚Ｐ偷叫袠I(yè)模型，要針對用戶的場景做最后一公里的事情?！?/p>

在評估基礎(chǔ)大模型所需要的投入，權(quán)衡利弊與得失之后，企業(yè)客戶迅速轉(zhuǎn)向行業(yè)大模型，廠商的精力也更多投入于此。

湯道生坦言，目前通用大模型一般都是基于廣泛的公開文獻與網(wǎng)絡(luò)信息來訓(xùn)練的，網(wǎng)上的信息可能有錯誤、有謠言、有偏見，許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足，導(dǎo)致模型的行業(yè)針對性與精準度不夠，數(shù)據(jù)“噪音”過大。

但是，在很多產(chǎn)業(yè)場景中，用戶對企業(yè)提供的專業(yè)服務(wù)要求高，容錯性低。企業(yè)一旦提供了錯誤信息，可能引起巨大的法律責(zé)任或公關(guān)危機。因此，企業(yè)使用的大模型必須可控、可追溯、可修正，而且必須反復(fù)與充分測試才能上線。

“我們認為，客戶更需要有行業(yè)針對性的行業(yè)大模型，再加上企業(yè)自己的數(shù)據(jù)做訓(xùn)練或精調(diào)，才能打造出實用性高的智能服務(wù)。企業(yè)所需要的是在實際場景中真正解決了某個問題，而不是在100個場景中解決了70%-80%的問題?！睖郎硎?。

百度智能云副總裁朱勇也表示，“從國內(nèi)和國外的情況可以看到，真正做通用模型的并沒有那么多，市面上有一些廠商做的實際上是比較小型的模型。相反，領(lǐng)域模型特別重要，因為通用模型只具備通識能力，領(lǐng)域模型可以跟特定行業(yè)、領(lǐng)域的任務(wù)預(yù)期對齊，解決業(yè)務(wù)的實際問題，這個過程非常重要，但這個過程所需要的代價和資源遠遠小于從零開始做底層通用模型。”

同時他還判斷，未來基礎(chǔ)模型（底層通用模型）可能就幾家，但是結(jié)合專業(yè)領(lǐng)域的數(shù)據(jù)、行業(yè)know how，上面會長出很多不同類型的領(lǐng)域模型，這些領(lǐng)域模型將來會非常繁榮，支撐上層繁榮的領(lǐng)域應(yīng)用。

以百度智能云和國網(wǎng)打造的能源行業(yè)大模型“國網(wǎng)-百度·文心”為例，百度智能云與國網(wǎng)專家們一起，在通用大模型行中引入國網(wǎng)在電力業(yè)務(wù)積累的樣本數(shù)據(jù)和特有知識，并且在訓(xùn)練中，結(jié)合雙方在預(yù)訓(xùn)練算法和電力領(lǐng)域業(yè)務(wù)與算法的經(jīng)驗，設(shè)計電力領(lǐng)域?qū)嶓w判別、電力領(lǐng)域文檔判別等算法作為預(yù)訓(xùn)練任務(wù)，讓文心大模型深入學(xué)習(xí)電力專業(yè)知識，從而真正解決能源領(lǐng)域的實際業(yè)務(wù)問題，達到降本增效的目的。

朱勇表示，通用模型跟領(lǐng)域模型的區(qū)別，可以把通用模型比作上了大學(xué)知識面很廣的人，他也許知道一些醫(yī)學(xué)的知識，但不能給病人做診斷，不是專業(yè)的醫(yī)生。而領(lǐng)域模型就是在通用能力很強的基礎(chǔ)上，深入學(xué)習(xí)醫(yī)學(xué)知識，成為了一名專業(yè)醫(yī)生，可以在醫(yī)學(xué)領(lǐng)域貢獻價值。

從具備很廣知識面的通用模型往專業(yè)的醫(yī)學(xué)模型，這中間所需要的資源代價，要遠遠少于從零到一開始建立通用大模型，但它強調(diào)的是有專業(yè)的數(shù)據(jù)，要有專業(yè)領(lǐng)域的任務(wù)來驅(qū)動，來激發(fā)它產(chǎn)生這樣的能力。

行業(yè)大模型怎么做

大模型本身就是一個新生事物，它改變了以往的軟件開發(fā)范式，廠商們更需要一套新的工具鏈和平臺，幫助客戶更早更快打磨行業(yè)大模型。

隨著大模型時代的到來，最后一公里的效率會大幅度提升。周明提到，新一代軟件開發(fā)范式正在形成，主要是基于企業(yè)prompt提供很多功能引擎，用戶現(xiàn)在是助手可以提高效率，在這個基礎(chǔ)上把自己的用戶體驗想清楚、設(shè)計好，就很容易地構(gòu)造一種新的應(yīng)用。

以文心千帆大模型平臺為例，是面向企業(yè)開發(fā)者的一站式大模型開發(fā)及服務(wù)運行平臺。不僅提供了包括文心一言底層模型（ERNIE-Bot）和第三方開源大模型，還提供了各種AI開發(fā)工具和整套開發(fā)環(huán)境，方便客戶輕松使用和開發(fā)大模型應(yīng)用。

諸如數(shù)據(jù)管理、自動化模型SFT以及推理服務(wù)云端部署，廠商希望能夠?qū)崿F(xiàn)一站式大模型定制服務(wù)。不同廠商的大模型構(gòu)建平臺能力基本相似，不同的是易用性、效果好壞、支持的軟硬件等方面。

“做大模型確實不便宜，但最終能夠讓大模型服務(wù)推廣開來的原因只有兩個：第一個是模型效果要好，模型效果不好，其他都不用講，第二個就是成本?！卑俣戎悄茉?AI 與大數(shù)據(jù)平臺總經(jīng)理忻舟表示。

在效果上，行業(yè)模型要依托于通用大模型。比如通識教育，如果沒有比較好的通用模型就沒法談在具體一個行業(yè)的應(yīng)用效果。Bloomberg和約翰霍普金斯一起推出的Bloomberg GPT就是例子，在它的數(shù)據(jù)分布中，通用基礎(chǔ)模型數(shù)據(jù)占一半，金融行業(yè)公開數(shù)據(jù)占一半，還有Bloomberg自己的數(shù)據(jù)占0.6%。

“任何一個模型要能達到較好的智能水平或者基礎(chǔ)能力，一定得在比較好的參數(shù)量訓(xùn)練基礎(chǔ)模型，在基礎(chǔ)模型上再融入一些行業(yè)專業(yè)數(shù)據(jù)做行業(yè)模型。”忻舟說。

百度的思路是先推出一個“大家伙”（文心一言），一個非常完整的工具平臺（文心千帆），然后根據(jù)客戶實際需求提供差異化的模型服務(wù)，幫助客戶做性價比最高的選擇，他們認為，價格不會成為企業(yè)擁抱大模型的瓶頸。

除了模型調(diào)用成本、訓(xùn)練成本，百度還在幫助企業(yè)做進一步的成本下降，如果企業(yè)只是聚焦在自己相對比較狹窄的領(lǐng)域上，百度也有相對低參數(shù)的版本，這樣在保證模型效果的同時，使用或者訓(xùn)練模型的成本將會大幅下降。

事實上，打造行業(yè)大模型的成本沒有通用標準。

首先，不同的基礎(chǔ)大模型有不同的參數(shù)規(guī)格，軟硬件投入要根據(jù)模型的基礎(chǔ)參數(shù)和能力動態(tài)變化。如果是百億參數(shù)，一臺A100卡也能跑起來，就能開始下游任務(wù)。

當前比較集中的應(yīng)用場景需求就屬于這類，比如知識管理類中智能問答、智能寫作、智能創(chuàng)作，還有泛互聯(lián)網(wǎng)營銷場景和代碼生成的需求。

其次，成本跟數(shù)據(jù)量和應(yīng)用方向有關(guān)。當前全球大模型定價都是以1000 Token為基礎(chǔ)單位計費。如果企業(yè)的下游任務(wù)很簡單，只需要幾萬token就能做好，那它的成本就非常低，需要的GPU卡就非常少。而構(gòu)建一個行業(yè)大模型所需的數(shù)據(jù)量通常以G甚至以T為單位，那它的離線訓(xùn)練成本就會非常高。

誰在搶跑？

大模型賽道玩家蜂擁而至，這次不僅僅是一線互聯(lián)網(wǎng)大廠，還有更多行業(yè)龍頭和創(chuàng)業(yè)公司加入。

哪些行業(yè)能率先突圍？或許從合作案例所處行業(yè)可以窺見一斑，如文章開頭的表格所示，金融、醫(yī)療、教育、自動駕駛等領(lǐng)域應(yīng)用頻繁。

例如，阿里云在四月份發(fā)布通義大模型時宣布已和多家企業(yè)已經(jīng)展開了合作探索，首批合作的企業(yè)有OPPO安第斯智能云、吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌悅科技等。據(jù)介紹，金融行業(yè)、零售行業(yè)，以及一些面向大型C端的場景和行業(yè)已經(jīng)積累了比較多的公開數(shù)據(jù)、場景數(shù)據(jù)，便于構(gòu)建企業(yè)或者行業(yè)專屬模型。

據(jù)公開資料顯示，百度文心行業(yè)大模型的數(shù)量已經(jīng)達到11個，覆蓋能源電力、金融、航天、傳媒、影視、汽車、城市管理、燃氣、保險、電子制造和社科多個領(lǐng)域。

6月27日發(fā)布的北京市首批十個人工智能行業(yè)大模型應(yīng)用案例涉及能源電力、醫(yī)療健康、金融、自動駕駛、建筑、科研、生活、問答等領(lǐng)域。據(jù)悉，6月27日至7月30日期間，北京市科委、中關(guān)村管委會還將聚焦城市治理、醫(yī)療健康、科學(xué)研究、智慧金融、智慧生活、智慧城市等重點領(lǐng)域，面向全市創(chuàng)新主體，將征集80余項行業(yè)大模型應(yīng)用案例項目。

但更多的客戶正面臨一波新的知識積累和學(xué)習(xí)的過程。

“我們和客戶交流時發(fā)現(xiàn)，很多客戶對行業(yè)大模型還不太了解，但會主動提出需要百度的行業(yè)大模型?！卑俣戎悄茉艫I平臺副總經(jīng)理李景秋說，這個時候會具體結(jié)合企業(yè)實際用的產(chǎn)品跟客戶解析需求，例如希望行業(yè)大模型具備什么樣的能力、用在什么系統(tǒng)或應(yīng)用里面、這些應(yīng)用到底被誰用、希望達到什么效果……這些問題問完之后，才會真正發(fā)現(xiàn)客戶需要的是基于文心千帆的工具鏈SFT的大模型，還是要構(gòu)建行業(yè)的預(yù)訓(xùn)練模型。后者起碼需要幾個月、甚至上年的時間去構(gòu)建部署——從數(shù)據(jù)的處理、算力層的資源配置等技術(shù)問題，到跟行業(yè)通用數(shù)據(jù)的長期訓(xùn)練。

從基礎(chǔ)大模型喧囂漸遠，到行業(yè)大模型華燈初上，邁入2023年下半年，一場真正的商業(yè)變革將加速啟動。

對比百度等國內(nèi)廠商和OpenAI/微軟在大模型領(lǐng)域的路徑，也是一件頗有意思的事情——在ChatGPT呈現(xiàn)全球現(xiàn)象級熱度時，有聲音質(zhì)疑，中國為什么做不出來ChatGPT，其中固然有技術(shù)環(huán)境、商業(yè)氛圍等一系列的復(fù)雜成因，最終很多人還是有一個粗淺的共識——“中國AI更傾向于業(yè)務(wù)應(yīng)用和商業(yè)化的能力”，直白點說，中國AI耐心更少，更想賺錢。

但反過來講，市場是技術(shù)發(fā)展的最大推動力，對于時間和節(jié)奏的把握，造就了不同的結(jié)果。就以行業(yè)大模型為例，微軟或是在等待技術(shù)的進一步成熟，或是覺得還沒到時機，慢了一步，國內(nèi)廠商迅速從基礎(chǔ)大模型過渡到行業(yè)大模型，大模型落地于場景，才能有持久的生命力。

失之東隅，收之桑榆，以結(jié)果論，國內(nèi)行業(yè)大模型跑得快，不是一件壞事。

（本文首發(fā)鈦媒體APP，作者 | 張帥，編輯 | 蓋虹達）

關(guān)鍵詞：

更多資訊>>