女人久久久,最近更新中文字幕在线,成人国内精品久久久久影院vr,中文字幕亚洲综合久久综合,久久精品秘?一区二区三区美小说

原創(chuàng)生活

國內(nèi) 商業(yè) 滾動

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費

生活滾動

保險 海外 觀察

財經(jīng) 生活 期貨

當前位置:科技 >

【全球聚看點】行業(yè)大模型,開卷! | 鈦媒體深度

文章來源:鈦媒體APP  發(fā)布時間: 2023-07-01 10:27:02  責任編輯:cfenews.com
+|-

“文心一言看起來是匆忙上馬,我認為這個東西根本就不是為了賺錢,就是為了能趕ChatGPT熱潮,行業(yè)大模型才是真正能產(chǎn)生商業(yè)價值的東西。”百度文心一言發(fā)布后不久,一位前百度員工對鈦媒體表示,“去年OpenAI沒這么火的時候,王老師(百度CTO王海峰)帶隊搞了10個大模型,就包括行業(yè)大模型,當時行業(yè)外關注不多,但如果現(xiàn)在看百度的布局,行業(yè)大模型其實是前瞻性布局,比OpenAI和微軟還早?!?/p>


【資料圖】

如今,通用大模型喧囂過后,行業(yè)模型正在逐漸占據(jù)聲量,也正印證這一現(xiàn)實:類似ChatGPT等基礎大模型賺的是“吆喝”,很大程度上是起到教育市場、塑造認知的作用,人工智能真正要落地、要賺到現(xiàn)在的錢,還要看行業(yè)大模型。

即便是海外市場,ChatGPT作為C端產(chǎn)品的部分屬性,熱度也已經(jīng)逐漸減弱——根據(jù)SimilarWeb數(shù)據(jù),前期ChatGPT的訪問量增長率驚人,1月份的環(huán)比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環(huán)比增長率為12.6%,到了5月,這個數(shù)字已經(jīng)變?yōu)榱?.8%,并預計6月的環(huán)比增長率有可能為負數(shù)。

“相信我們當中的很多人都試用過了ChatGPT,也相信很多人試用過之后,已經(jīng)將它放置一邊了,因為目前它和我們的工作基本上還是割裂的,所以用用就放下了。但我依然希望大家不要‘起個大早,趕了晚集’,因為這是一個會帶來顛覆性變革的范式革命?!蔽④洠ㄖ袊┕臼紫夹g官(CTO)韋青此前表示。

而基于ChatGPT或者大模型,打造的B端解決方案,正是解決大模型與場景割裂的良方。

國際上,微軟、亞馬遜等大廠也開始向企業(yè)級服務尋求商業(yè)化路徑,開始進行多個行業(yè)的探索;國內(nèi),諸如百度、阿里、騰訊、華為都在快馬加鞭加速行業(yè)大模型投入。此外,很多全球范圍內(nèi)的行業(yè)龍頭和創(chuàng)業(yè)公司也正在探索行業(yè)大模型的前景,近日,北京市科委、中關村管委會也發(fā)布了北京市首批10個人工智能行業(yè)大模型應用案例。此外,相關技術路線的企業(yè)并購金額也屢攀新高……

但大模型賽道還遠遠稱不上擁擠——伴隨技術迭代迎來飛躍式發(fā)展,各行各業(yè)正重新積累技術認知、塑造業(yè)務模式,一切才剛剛開始。

升級:千模大戰(zhàn)

如果說基礎模型是“百模大戰(zhàn)”,行業(yè)大模型就是“千模大戰(zhàn)”,就像樹干長出樹枝,每個基礎大模型廠商都可以孵化數(shù)個行業(yè)大模型,大廠們的行動默契而一致。

“雖然大家對通用大模型期待很高,但它不一定是滿足行業(yè)場景需求的最優(yōu)解?!?月19日,在騰訊云行業(yè)大模型發(fā)布會上,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示。

在混元助手沒有對外發(fā)布的情況下,騰訊率先發(fā)布了行業(yè)大模型,依托騰訊云TI平臺打造的行業(yè)大模型精選商店,為客戶提供MaaS一站式服務,幫助企業(yè)客戶構(gòu)建專屬大模型及智能應用。從騰訊處獲悉,有關C端的通用大模型,騰訊將在后續(xù)發(fā)布官方消息。

這一系列舉措或許可以理解為,暫且不論混元基礎大模型的效果和進展如何,優(yōu)先發(fā)布行業(yè)大模型,是在客戶急需的情況下,騰訊確保自身聲量、搶占市場客戶的必要之舉。

更早之前,華為云人工智能領域首席科學家田奇提到,華為把大模型分成三個層級,L0、L1、L2,L0就是大家所說的基礎通用模型,像GPT-3,在基礎模型L0的基礎上,加上行業(yè)數(shù)據(jù),混合訓練得到的行業(yè)大模型是L1。

然后再把L1針對具體下游千行百業(yè)的細分場景進行一些部署,得到細分場景的任務模型L2,為了盡快降低生產(chǎn)成本、提高效率,如何從行業(yè)大模型L1中快速生產(chǎn)L2模型,還有部署L2模型到端側(cè)、邊側(cè)和云側(cè),這是非常重要的問題。

在7月即將舉辦的華為開發(fā)者大會的議程上可以看到,華為云將對盤古大模型如何從基礎大模型煉成行業(yè)大模型進行一系列的解讀和發(fā)布。

在今年的阿里云峰會上,阿里云CTO周靖人也表示,“今天不是所有的企業(yè)都需要從頭開始訓練,也不需要大家從頭開始去做多種語料,包括大量的算力資源,從頭開始做大模型的一系列定制,我們希望今天通義千問模型之上,結(jié)合企業(yè)的場景、企業(yè)的知識體系、企業(yè)的行業(yè)特殊需求,產(chǎn)生一個個企業(yè)專屬模型?!?/p>

微軟也在做自己的行業(yè)大模型。4月份,在國內(nèi),針對本土出海企業(yè)用戶,微軟Azure OpenAI Service國際版發(fā)布了首批三套面向零售電商、制造業(yè)和數(shù)字原生領域的Azure全球創(chuàng)新行業(yè)場景,集成GPT-3、GPT-4、Codex、DALL-E和企業(yè)級ChatGPT等五種大模型服務,幫助中國出海企業(yè)客戶加速拓展全球市場。

“千模大戰(zhàn)”一觸即發(fā),但真正進入大浪淘沙的階段還為時尚早——整體來說,大模型還處于比較早期的發(fā)展階段,盡管行業(yè)大模型集中涌現(xiàn),但這條賽道顯然有更大空間。

以金融行業(yè)大模型為例,其分成券商、保險、銀行、新金融等不同領域,每個領域的下游任務又分成幾十上百種的子任務。

“更重要的時刻,是接下來基于基礎模型,通過SFT等機制和構(gòu)建出能夠高效適配下游任務,并且在金融行業(yè)或者其他行業(yè)模型的下游任務產(chǎn)生規(guī)模效應化的時候?!痹诎⒗锇桶瓦_摩院創(chuàng)新業(yè)務中心負責人陳海青看來,只是通過一些普適的非結(jié)構(gòu)化數(shù)據(jù)做繼續(xù)訓練的行業(yè)大模型和場景,才算剛剛開始。

理智且現(xiàn)實的選擇

如果企業(yè)要做一個千億級參數(shù)的基礎大模型,需要單機群萬卡以上的算力,不僅要有GPU卡,還要把GPU的集群資源利用起來,大部分公司都無法做到。

而行業(yè)大模型顯然更容易實現(xiàn),同時也兼具更廣闊的應用前景。

“大模型賦能千行百業(yè),但是對千行百業(yè)的場景要非常理解,不能指望訓練出千億或者萬億大模型,企業(yè)用戶拿去就好用”,瀾舟科技創(chuàng)始人周明說?!皬耐ㄓ媚P偷叫袠I(yè)模型,要針對用戶的場景做最后一公里的事情?!?/p>

在評估基礎大模型所需要的投入,權衡利弊與得失之后,企業(yè)客戶迅速轉(zhuǎn)向行業(yè)大模型,廠商的精力也更多投入于此。

湯道生坦言,目前通用大模型一般都是基于廣泛的公開文獻與網(wǎng)絡信息來訓練的,網(wǎng)上的信息可能有錯誤、有謠言、有偏見,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導致模型的行業(yè)針對性與精準度不夠,數(shù)據(jù)“噪音”過大。

但是,在很多產(chǎn)業(yè)場景中,用戶對企業(yè)提供的專業(yè)服務要求高,容錯性低。企業(yè)一旦提供了錯誤信息,可能引起巨大的法律責任或公關危機。因此,企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須反復與充分測試才能上線。

“我們認為,客戶更需要有行業(yè)針對性的行業(yè)大模型,再加上企業(yè)自己的數(shù)據(jù)做訓練或精調(diào),才能打造出實用性高的智能服務。企業(yè)所需要的是在實際場景中真正解決了某個問題,而不是在100個場景中解決了70%-80%的問題?!睖郎硎?。

百度智能云副總裁朱勇也表示,“從國內(nèi)和國外的情況可以看到,真正做通用模型的并沒有那么多,市面上有一些廠商做的實際上是比較小型的模型。相反,領域模型特別重要,因為通用模型只具備通識能力,領域模型可以跟特定行業(yè)、領域的任務預期對齊,解決業(yè)務的實際問題,這個過程非常重要,但這個過程所需要的代價和資源遠遠小于從零開始做底層通用模型。”

同時他還判斷,未來基礎模型(底層通用模型)可能就幾家,但是結(jié)合專業(yè)領域的數(shù)據(jù)、行業(yè)know how,上面會長出很多不同類型的領域模型,這些領域模型將來會非常繁榮,支撐上層繁榮的領域應用。

以百度智能云和國網(wǎng)打造的能源行業(yè)大模型“國網(wǎng)-百度·文心”為例,百度智能云與國網(wǎng)專家們一起,在通用大模型行中引入國網(wǎng)在電力業(yè)務積累的樣本數(shù)據(jù)和特有知識,并且在訓練中,結(jié)合雙方在預訓練算法和電力領域業(yè)務與算法的經(jīng)驗,設計電力領域?qū)嶓w判別、電力領域文檔判別等算法作為預訓練任務,讓文心大模型深入學習電力專業(yè)知識,從而真正解決能源領域的實際業(yè)務問題,達到降本增效的目的。

朱勇表示,通用模型跟領域模型的區(qū)別,可以把通用模型比作上了大學知識面很廣的人,他也許知道一些醫(yī)學的知識,但不能給病人做診斷,不是專業(yè)的醫(yī)生。而領域模型就是在通用能力很強的基礎上,深入學習醫(yī)學知識,成為了一名專業(yè)醫(yī)生,可以在醫(yī)學領域貢獻價值。

從具備很廣知識面的通用模型往專業(yè)的醫(yī)學模型,這中間所需要的資源代價,要遠遠少于從零到一開始建立通用大模型,但它強調(diào)的是有專業(yè)的數(shù)據(jù),要有專業(yè)領域的任務來驅(qū)動,來激發(fā)它產(chǎn)生這樣的能力。

行業(yè)大模型怎么做

大模型本身就是一個新生事物,它改變了以往的軟件開發(fā)范式,廠商們更需要一套新的工具鏈和平臺,幫助客戶更早更快打磨行業(yè)大模型。

隨著大模型時代的到來,最后一公里的效率會大幅度提升。周明提到,新一代軟件開發(fā)范式正在形成,主要是基于企業(yè)prompt提供很多功能引擎,用戶現(xiàn)在是助手可以提高效率,在這個基礎上把自己的用戶體驗想清楚、設計好,就很容易地構(gòu)造一種新的應用。

以文心千帆大模型平臺為例,是面向企業(yè)開發(fā)者的一站式大模型開發(fā)及服務運行平臺。不僅提供了包括文心一言底層模型(ERNIE-Bot)和第三方開源大模型,還提供了各種AI開發(fā)工具和整套開發(fā)環(huán)境,方便客戶輕松使用和開發(fā)大模型應用。

諸如數(shù)據(jù)管理、自動化模型SFT以及推理服務云端部署,廠商希望能夠?qū)崿F(xiàn)一站式大模型定制服務。不同廠商的大模型構(gòu)建平臺能力基本相似,不同的是易用性、效果好壞、支持的軟硬件等方面。

“做大模型確實不便宜,但最終能夠讓大模型服務推廣開來的原因只有兩個:第一個是模型效果要好,模型效果不好,其他都不用講,第二個就是成本?!卑俣戎悄茉?AI 與大數(shù)據(jù)平臺總經(jīng)理忻舟表示。

在效果上,行業(yè)模型要依托于通用大模型。比如通識教育,如果沒有比較好的通用模型就沒法談在具體一個行業(yè)的應用效果。Bloomberg和約翰霍普金斯一起推出的Bloomberg GPT就是例子,在它的數(shù)據(jù)分布中,通用基礎模型數(shù)據(jù)占一半,金融行業(yè)公開數(shù)據(jù)占一半,還有Bloomberg自己的數(shù)據(jù)占0.6%。

“任何一個模型要能達到較好的智能水平或者基礎能力,一定得在比較好的參數(shù)量訓練基礎模型,在基礎模型上再融入一些行業(yè)專業(yè)數(shù)據(jù)做行業(yè)模型。”忻舟說。

百度的思路是先推出一個“大家伙”(文心一言),一個非常完整的工具平臺(文心千帆),然后根據(jù)客戶實際需求提供差異化的模型服務,幫助客戶做性價比最高的選擇,他們認為,價格不會成為企業(yè)擁抱大模型的瓶頸。

除了模型調(diào)用成本、訓練成本,百度還在幫助企業(yè)做進一步的成本下降,如果企業(yè)只是聚焦在自己相對比較狹窄的領域上,百度也有相對低參數(shù)的版本,這樣在保證模型效果的同時,使用或者訓練模型的成本將會大幅下降。

事實上,打造行業(yè)大模型的成本沒有通用標準。

首先,不同的基礎大模型有不同的參數(shù)規(guī)格,軟硬件投入要根據(jù)模型的基礎參數(shù)和能力動態(tài)變化。如果是百億參數(shù),一臺A100卡也能跑起來,就能開始下游任務。

當前比較集中的應用場景需求就屬于這類,比如知識管理類中智能問答、智能寫作、智能創(chuàng)作,還有泛互聯(lián)網(wǎng)營銷場景和代碼生成的需求。

其次,成本跟數(shù)據(jù)量和應用方向有關。當前全球大模型定價都是以1000 Token為基礎單位計費。如果企業(yè)的下游任務很簡單,只需要幾萬token就能做好,那它的成本就非常低,需要的GPU卡就非常少。而構(gòu)建一個行業(yè)大模型所需的數(shù)據(jù)量通常以G甚至以T為單位,那它的離線訓練成本就會非常高。

誰在搶跑?

大模型賽道玩家蜂擁而至,這次不僅僅是一線互聯(lián)網(wǎng)大廠,還有更多行業(yè)龍頭和創(chuàng)業(yè)公司加入。

哪些行業(yè)能率先突圍?或許從合作案例所處行業(yè)可以窺見一斑,如文章開頭的表格所示,金融、醫(yī)療、教育、自動駕駛等領域應用頻繁。

例如,阿里云在四月份發(fā)布通義大模型時宣布已和多家企業(yè)已經(jīng)展開了合作探索,首批合作的企業(yè)有OPPO安第斯智能云、吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌悅科技等。據(jù)介紹,金融行業(yè)、零售行業(yè),以及一些面向大型C端的場景和行業(yè)已經(jīng)積累了比較多的公開數(shù)據(jù)、場景數(shù)據(jù),便于構(gòu)建企業(yè)或者行業(yè)專屬模型。

據(jù)公開資料顯示,百度文心行業(yè)大模型的數(shù)量已經(jīng)達到11個,覆蓋能源電力、金融、航天、傳媒、影視、汽車、城市管理、燃氣、保險、電子制造和社科多個領域。

6月27日發(fā)布的北京市首批十個人工智能行業(yè)大模型應用案例涉及能源電力、醫(yī)療健康、金融、自動駕駛、建筑、科研、生活、問答等領域。據(jù)悉,6月27日至7月30日期間,北京市科委、中關村管委會還將聚焦城市治理、醫(yī)療健康、科學研究、智慧金融、智慧生活、智慧城市等重點領域,面向全市創(chuàng)新主體,將征集80余項行業(yè)大模型應用案例項目。

但更多的客戶正面臨一波新的知識積累和學習的過程。

“我們和客戶交流時發(fā)現(xiàn),很多客戶對行業(yè)大模型還不太了解,但會主動提出需要百度的行業(yè)大模型?!卑俣戎悄茉艫I平臺副總經(jīng)理李景秋說,這個時候會具體結(jié)合企業(yè)實際用的產(chǎn)品跟客戶解析需求,例如希望行業(yè)大模型具備什么樣的能力、用在什么系統(tǒng)或應用里面、這些應用到底被誰用、希望達到什么效果……這些問題問完之后,才會真正發(fā)現(xiàn)客戶需要的是基于文心千帆的工具鏈SFT的大模型,還是要構(gòu)建行業(yè)的預訓練模型。后者起碼需要幾個月、甚至上年的時間去構(gòu)建部署——從數(shù)據(jù)的處理、算力層的資源配置等技術問題,到跟行業(yè)通用數(shù)據(jù)的長期訓練。

從基礎大模型喧囂漸遠,到行業(yè)大模型華燈初上,邁入2023年下半年,一場真正的商業(yè)變革將加速啟動。

對比百度等國內(nèi)廠商和OpenAI/微軟在大模型領域的路徑,也是一件頗有意思的事情——在ChatGPT呈現(xiàn)全球現(xiàn)象級熱度時,有聲音質(zhì)疑,中國為什么做不出來ChatGPT,其中固然有技術環(huán)境、商業(yè)氛圍等一系列的復雜成因,最終很多人還是有一個粗淺的共識——“中國AI更傾向于業(yè)務應用和商業(yè)化的能力”,直白點說,中國AI耐心更少,更想賺錢。

但反過來講,市場是技術發(fā)展的最大推動力,對于時間和節(jié)奏的把握,造就了不同的結(jié)果。就以行業(yè)大模型為例,微軟或是在等待技術的進一步成熟,或是覺得還沒到時機,慢了一步,國內(nèi)廠商迅速從基礎大模型過渡到行業(yè)大模型,大模型落地于場景,才能有持久的生命力。

失之東隅,收之桑榆,以結(jié)果論,國內(nèi)行業(yè)大模型跑得快,不是一件壞事。

(本文首發(fā)鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)

關鍵詞:

專題首頁|財金網(wǎng)首頁

投資
探索

精彩
互動

獨家
觀察

京ICP備2021034106號-38   營業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com 關于我們 財金網(wǎng)  版權所有  cfenews.com