ChatGPT概念火到安全圈,大模型在垂直領(lǐng)域的應(yīng)用實(shí)踐戰(zhàn)已經(jīng)打響。
繼各互聯(lián)網(wǎng)大廠相繼披露GPT研發(fā)進(jìn)程后,網(wǎng)絡(luò)安全廠商也蠢蠢欲動(dòng),并在第一時(shí)間試驗(yàn)了OpenAI的ChatGPT到底實(shí)力如何以及值不值得應(yīng)用和投入。如其轟動(dòng)世界的效果一樣,作為通用大模型,OpenAI的ChatGPT同樣讓網(wǎng)絡(luò)安全從業(yè)者眼前一亮,并開(kāi)始尋找GPT與網(wǎng)絡(luò)安全實(shí)際業(yè)務(wù)之間的場(chǎng)景融合點(diǎn)。
【資料圖】
可識(shí)別釣魚(yú)郵件,也能生成誘餌
完全可以識(shí)別釣魚(yú)郵件,并利用其語(yǔ)言理解能力,分析和識(shí)別文本中的潛在釣魚(yú)攻擊特征,從而幫助識(shí)別和預(yù)防釣魚(yú)攻擊——這是網(wǎng)絡(luò)安全從業(yè)者在試用ChatGPT后的主要發(fā)現(xiàn)之一。
但硬幣的另一面,ChatGPT也可以根據(jù)人工提示生成非常逼真的誘餌素材,并使受害者相信他們正在與真實(shí)的人交談。這使得社交工程攻擊變得更加容易,攻擊者可以通過(guò) GPT 輕松地模擬受害者的社交網(wǎng)絡(luò)上的朋友或家人。
所以,GPT與網(wǎng)絡(luò)安全最直接的關(guān)系其實(shí)是跟隨GPT對(duì)數(shù)據(jù)安全帶來(lái)的潛在機(jī)遇與挑戰(zhàn)而產(chǎn)生的。多位業(yè)內(nèi)人士的一個(gè)共同判斷是,依托于GPT的自動(dòng)化攻擊手段被黑客很快采用是既定事實(shí),如果不能以同樣的方式快速應(yīng)對(duì)攻擊手段的變化,企業(yè)、甚至是國(guó)家關(guān)鍵信息基礎(chǔ)設(shè)施都可能時(shí)刻受到來(lái)自網(wǎng)絡(luò)的安全威脅。
“現(xiàn)在,迫切需要我們?cè)诰W(wǎng)絡(luò)安全領(lǐng)域具備能打硬仗的能力?!币晃痪W(wǎng)絡(luò)安全領(lǐng)域的創(chuàng)始人兼CEO表示?!?strong>安全就是攻防對(duì)抗,這類技術(shù)的出現(xiàn),有點(diǎn)像火器的出現(xiàn)。兩軍對(duì)陣,本來(lái)拿著大刀長(zhǎng)矛的,當(dāng)火器技術(shù)出現(xiàn)了,它會(huì)重塑人類的戰(zhàn)爭(zhēng)、行為方式。”另一位大廠安全業(yè)務(wù)負(fù)責(zé)人也說(shuō)。
出于或許相同的初衷,鈦媒體App不完全統(tǒng)計(jì)發(fā)現(xiàn),當(dāng)前,已經(jīng)有不少于7家網(wǎng)絡(luò)安全的公司披露了將GPT應(yīng)用在網(wǎng)絡(luò)安全領(lǐng)域的進(jìn)展,包括微軟的Microsoft Security Copilot、360集團(tuán)的360智腦、綠盟科技的智能安全客服機(jī)器人、啟明星辰的盤(pán)小古以及四維創(chuàng)智的ChatCS等等。
網(wǎng)絡(luò)安全領(lǐng)域類ChatGPT應(yīng)用
從各家披露的GPT落地方向來(lái)看,大部分都是面向安全事件響應(yīng)、漏洞挖掘、風(fēng)險(xiǎn)研判等場(chǎng)景。不過(guò),在與業(yè)內(nèi)人士交流的過(guò)程中,鈦媒體App發(fā)現(xiàn),雖然落地場(chǎng)景有重合,但從實(shí)現(xiàn)的技術(shù)路徑上,各家表現(xiàn)出了些許差異。
技術(shù)路線各有不同
拆解技術(shù)路線,其實(shí)還要從ChatGPT說(shuō)起。
OpenAI的ChatGPT以及隨后迭代出的GPT4.0,包括當(dāng)前百度推出的文心一言等都屬于通用大模型,都沒(méi)有明顯的行業(yè)屬性,在一般場(chǎng)景下都能應(yīng)對(duì)自如,比如客服、文生圖等等。但遇到特別垂類且對(duì)答案容錯(cuò)率較低的行業(yè)來(lái)說(shuō),由于缺乏專業(yè)知識(shí),這類通用大模型會(huì)表現(xiàn)出可預(yù)見(jiàn)的劣勢(shì)。
所以當(dāng)網(wǎng)絡(luò)安全行業(yè)在使用GPT的時(shí)候,并不能像其他行業(yè)一樣直接接入已經(jīng)訓(xùn)練好的GPT4.0,而是需要重新構(gòu)建一個(gè)用網(wǎng)絡(luò)安全領(lǐng)域的專業(yè)知識(shí)訓(xùn)練出的大模型,然后再將其應(yīng)用到實(shí)踐中。
不過(guò),在與業(yè)內(nèi)人士交流的過(guò)程中,鈦媒體App發(fā)現(xiàn),同樣是訓(xùn)練網(wǎng)絡(luò)安全領(lǐng)域的大模型,各家所選擇的技術(shù)路線也有所差異:他們有的是先有安全知識(shí)圖譜,然后在類ChatGPT的大模型基礎(chǔ)上加工;有的是沒(méi)有類ChatGPT的大模型,而是直接用安全知識(shí)圖譜訓(xùn)練成一個(gè)大模型;也有的可能并沒(méi)有強(qiáng)調(diào)知識(shí)圖譜,而是用所有數(shù)據(jù)直接訓(xùn)練。
“過(guò)往實(shí)踐過(guò)程中,我們積累了大量數(shù)據(jù),這些數(shù)據(jù)可能包含了安全日志、系統(tǒng)日志,威脅情報(bào)生產(chǎn)和分析過(guò)程數(shù)據(jù),開(kāi)源情報(bào)和安全技術(shù)報(bào)告、APT報(bào)告等等,這些數(shù)據(jù)通過(guò)AI智能化,形成一系列實(shí)戰(zhàn)化攻防模型以及安全知識(shí)圖譜?!本G盟科技CTO葉曉虎表示。
在有了實(shí)戰(zhàn)化攻防模型以及安全知識(shí)圖譜后,綠盟科技利用類ChatGPT的大語(yǔ)言模型對(duì)這些知識(shí)做進(jìn)一步加工,形成安全專業(yè)領(lǐng)域里面的類GPT的應(yīng)用,即今年三季度即將發(fā)布的網(wǎng)絡(luò)安全領(lǐng)域知識(shí)問(wèn)答系統(tǒng)。
“我們所有下游任務(wù)都只基于ChatCS這一個(gè)大模型。在訓(xùn)練和應(yīng)用ChatCS之前,我們先花費(fèi)精力做網(wǎng)絡(luò)安全領(lǐng)域的通用知識(shí)圖譜,然后利用知識(shí)圖譜的異構(gòu)數(shù)據(jù)歸一化能力生成數(shù)據(jù)集再去訓(xùn)練網(wǎng)絡(luò)安全領(lǐng)域的大模型?!彼木S創(chuàng)智人工智能項(xiàng)目負(fù)責(zé)人表示。
他解釋稱,他們所推出的ChatCS,是一個(gè)使用RLHF技術(shù)微調(diào)并利用知識(shí)圖譜進(jìn)行領(lǐng)域知識(shí)約束的垂直領(lǐng)域大語(yǔ)言模型。思路是首先構(gòu)建以“漏洞概念”為核心的網(wǎng)絡(luò)安全領(lǐng)域知識(shí)圖譜—Vuln_Sprocket,再將圖譜生成先驗(yàn)知識(shí)集訓(xùn)練模型,后續(xù),ChatCS能夠背景知識(shí)對(duì)用戶原始指令進(jìn)行優(yōu)化。在最新的測(cè)試版本中,ChatCS_test 盡管只具備82億參數(shù),但已經(jīng)可以很好的完成領(lǐng)域知識(shí)問(wèn)答、測(cè)試腳本生成、告警日志分析等操作。
目前,其余幾家網(wǎng)絡(luò)安全廠商還未完全披露訓(xùn)練GPT的路徑細(xì)節(jié),但據(jù)業(yè)內(nèi)人士分析,360集團(tuán)的網(wǎng)絡(luò)安全GPT應(yīng)該是以通用大模型為底座,然后加入網(wǎng)絡(luò)安全相關(guān)數(shù)據(jù)調(diào)優(yōu)的路徑,與綠盟科技和四維創(chuàng)智都有很大不同。
不過(guò)殊途同歸。綠盟科技CTO葉曉虎稱,智能安全客服機(jī)器人達(dá)到的效果是,應(yīng)用可以在安全事件應(yīng)急響應(yīng)處置、海量日志分析研判、安全智能推理和決策、安全領(lǐng)域的代碼編寫(xiě)等方面發(fā)揮積極作用。其余廠商的GPT實(shí)踐也與此多有重合。
又是一場(chǎng)長(zhǎng)跑
值得注意的是,自ChatGPT爆火以來(lái),也才100余天的時(shí)間。短短三四個(gè)月,網(wǎng)絡(luò)安全廠商們能夠快速上馬ChatGPT與其背后已經(jīng)積累的相關(guān)數(shù)據(jù)集有很大關(guān)系。但需要思考的一個(gè)問(wèn)題是,既然網(wǎng)絡(luò)安全行業(yè)迫切需要也能夠有自己的大模型,為什么當(dāng)OpenAI火了之后,網(wǎng)絡(luò)安全圈才關(guān)注到大模型即將帶來(lái)的變革?
原因可能在于,對(duì)于大模型來(lái)說(shuō),技術(shù)可能并不是根本問(wèn)題。問(wèn)題一方面在高質(zhì)量的安全數(shù)據(jù)語(yǔ)料,而另一方面則是保持對(duì)人工智能信仰以及持續(xù)訓(xùn)練大模型的心態(tài)和思維。
“之前只是小規(guī)模嘗試過(guò)網(wǎng)絡(luò)安全AI自動(dòng)化的事情,一兩次不達(dá)預(yù)期就沒(méi)有再嘗試。但ChatGPT用事實(shí)告訴我們這條路行得通,大家才敢放手投入?!币晃痪W(wǎng)絡(luò)安全創(chuàng)業(yè)者表示。
除了試錯(cuò)成功,大模型出現(xiàn)告訴網(wǎng)絡(luò)安全屆的另一個(gè)信號(hào)是,大模型確實(shí)有可能導(dǎo)致對(duì)抗方式底層邏輯的變化?!叭绻ㄓ么竽P湍軌虬阎悄芡评砗椭悄軟Q策應(yīng)用這條路走通的話,實(shí)際上可以讓對(duì)抗方式從過(guò)去的經(jīng)驗(yàn)式變成范式化工作,之前經(jīng)驗(yàn)存在于人腦,沒(méi)辦法復(fù)用,但如果走通這方面會(huì)有很多變化?!比~曉虎說(shuō)。
很顯然,OpenAI的ChatGPT僅僅只是個(gè)開(kāi)始,無(wú)數(shù)的試錯(cuò)在等待蜂擁而上的中國(guó)創(chuàng)業(yè)者。這又是一場(chǎng)長(zhǎng)跑。(本文首發(fā)鈦媒體APP 作者 |秦聰慧)?
關(guān)鍵詞: