今天,我們的生活已經(jīng)很難再脫離網(wǎng)絡(luò)。雖然互聯(lián)網(wǎng)給我們帶來了前所未有的巨量信息,但這些信息卻并不都是真實和有用的信息。事實上,今天的互聯(lián)網(wǎng)中,有大量的機(jī)器人賬號存在。機(jī)器人賬號由算法來模仿人類的行為習(xí)慣進(jìn)行操控,不需要真人的參與就可以自動完成發(fā)帖、評論和轉(zhuǎn)發(fā)。
雖然大部分人并不了解甚至不知道機(jī)器人賬號的存在,但機(jī)器人賬號已經(jīng)成為影響輿論和干擾數(shù)據(jù)的重要因素。那么,機(jī)器人賬號到底為何而存在?又該如何被管理?除了造成虛假的信息泛濫,機(jī)器人賬號還有沒有其他用途?
【資料圖】
龐大的機(jī)器人賬號
機(jī)器人賬號其實就是一種能夠在社交網(wǎng)絡(luò)上接收指令并模仿正常人類用戶行為的智能程序。并且,隨著人工智能的發(fā)展,從創(chuàng)建應(yīng)用軟件、官方網(wǎng)站或內(nèi)容傳播平臺,到生產(chǎn)具有實質(zhì)性內(nèi)容的圖像、視頻或文字,通過或真或假或自動地與用戶交互,今天,機(jī)器人賬號已經(jīng)越來越“真實”。
作為能模仿正常人類用戶行為的智能程序,機(jī)器人賬號最大的特點,就是龐大。早在2017年,就有研究人員報告了其發(fā)現(xiàn)的一個Twitter僵尸網(wǎng)絡(luò),其中包含超過35萬個機(jī)器人帳戶。這是一個具有難以想象比例的網(wǎng)絡(luò),它自2013年誕生以來就一直未被發(fā)現(xiàn)。
同年,來自美國馬里蘭州的網(wǎng)絡(luò)安全公司ZeroFOX公布了一份研究報告,揭開了Twitter平臺大規(guī)模垃圾色情郵件僵尸網(wǎng)絡(luò)的冰山一角:根據(jù)報告,被ZeroFOX定點追蹤、被稱為“SIREN”的Twitter僵尸網(wǎng)絡(luò),包含超過90000個偽造的賬號,總計發(fā)布了超過850萬條包含惡意鏈接的推文。這些內(nèi)容僅在調(diào)查結(jié)束前的數(shù)周之內(nèi),就產(chǎn)生了超過3000萬次的推特用戶點擊。
中文網(wǎng)絡(luò)輿論場的網(wǎng)絡(luò)水軍問題也很突出。打開手機(jī),我們在社交媒體上收到的評論與轉(zhuǎn)發(fā),在問答平臺上看到的點贊和收藏,微博時常莫名的關(guān)注,和直播營銷好看的數(shù)據(jù),這些與我們展開互動的陌生ID和互聯(lián)網(wǎng)呈現(xiàn)給我們的數(shù)字現(xiàn)象,背后的控制者,很可能就是機(jī)器人賬號。
微博大V動輒坐擁數(shù)千萬粉絲,其真實性也很可疑。曾有“一找照妖鏡”網(wǎng)站專查“活粉”比例,大V們近80%的粉絲都是僵尸粉。新浪微博里首個突破一億粉絲的女藝人,我們不會真的相信是有一億個人關(guān)注了她;百分百好評的商品,消費(fèi)者也會對其持有懷疑;事實上,批量生產(chǎn)的機(jī)器人賬號,流量造假的媒介狂歡,早已在中文社交網(wǎng)絡(luò)上泛濫成災(zāi)。
龐大的的機(jī)器人賬號背后,其實是產(chǎn)業(yè)鏈的發(fā)展。2018年1月,《紐約時報》刊發(fā)調(diào)查報道,就揭秘了美國的“僵尸粉制造工廠”。一家名為Devumi的公司在社交媒體上通過“造粉”和“賣粉”賺了上千萬美元。而Devumi生產(chǎn)僵尸粉的流程就在于,先“復(fù)制”一批真實存在的網(wǎng)絡(luò)用戶的照片、資料和賬戶細(xì)節(jié)等,把它們做成“機(jī)器人粉絲”,然后賣給演員、企業(yè)家、政治評論員等“想出名或是想在互聯(lián)網(wǎng)上施加影響力的人”。此外,Devumi還提供轉(zhuǎn)發(fā)、點贊等服務(wù)。
這家“地下工廠”共造了350萬個僵尸粉,而且每個僵尸粉都被多次買賣,累計起來提供的“假粉絲”數(shù)量超過兩億。Devumi不僅在推特上,還在拼趣(Pinterest)、領(lǐng)英和優(yōu)兔等網(wǎng)站上開展生意。
機(jī)器人賬號背后的生意經(jīng)
機(jī)器人賬號之所以能夠催生出像Devumi一樣的公司,根本上還是利益導(dǎo)向的結(jié)果。如今的互聯(lián)網(wǎng)已經(jīng)變身一個“唯流量”時代,流量在哪里,就以為著關(guān)注點在哪里,大家就認(rèn)為市場在哪里。
傳統(tǒng)媒體時代,主要的流量造假者大多來自傳統(tǒng)媒體,報紙夸大發(fā)行量、廣電對于收視聽率的調(diào)查樣本進(jìn)行污染的情況時有發(fā)生?;ヂ?lián)網(wǎng)時代,電商等新消費(fèi)形態(tài)逐漸普及,對于轉(zhuǎn)化率等數(shù)據(jù)第一次有了網(wǎng)絡(luò)采集與對照的可能,流量造假就有了更強(qiáng)烈的需求驅(qū)動,點擊率等指標(biāo)被注水成為常態(tài)。
這是數(shù)據(jù)的時代,也是虛假盛行的時代。機(jī)器人賬號造成的大量信息,不僅讓虛假蔓延在互聯(lián)網(wǎng)領(lǐng)域,基于機(jī)器人賬號的流量造假、流量劫持,還會破壞商業(yè)模式,損害數(shù)據(jù)信息價值,造成大數(shù)據(jù)產(chǎn)業(yè)“劣幣驅(qū)逐良幣”。為了追求自身的利益最大化的流量造假,也違背了誠信的原則。而當(dāng)數(shù)據(jù)造假成為一種產(chǎn)業(yè),每個參與其中的人都因自身獲利而或多或少助長了造假現(xiàn)象的持續(xù)蔓延。
此外,機(jī)器人賬號也被廣泛用于操縱輿論,而其背后往往是為了某一利益集團(tuán)服務(wù)。在影響輿論方面,2018年麻省理工學(xué)院的研究團(tuán)隊,通過對Twitter輿論事件話題下的發(fā)言進(jìn)行歸納分析,得出一個驚人的結(jié)論:只要保證充足的活躍度,哪怕實際數(shù)量還不到參與用戶總數(shù)的1%,Twitter上的機(jī)器人賬號,依舊能夠影響輿論的風(fēng)向走勢。
這項研究的樣本輿論事件,正是2016年的美國總統(tǒng)大選。通過對收集到的77563個用戶樣本展開分析,麻省理工學(xué)院的研究者篩選出了7702個不會改變立場的頑固用戶;隨后經(jīng)過進(jìn)一步篩選,總共鎖定了396個僵尸賬戶——260個支持特朗普,136個支持希拉里,加在一起不到用戶樣本總數(shù)的5%。
盡管占比不高,但憑借遠(yuǎn)超真人用戶的活躍度,這400個僵尸賬戶扮演的“意見領(lǐng)袖”,成功將雙方候選人的觀點推向極端化,為兩邊吸引了數(shù)量可觀的真實支持者,最終實現(xiàn)了微妙的“平分秋色”。
而輿論操縱背后,有研究顯示,有100多個支持特朗普的偽造網(wǎng)站都來自遠(yuǎn)在南歐巴爾干半島馬其頓的韋萊斯小鎮(zhèn),鎮(zhèn)上的年輕人想趁美國大選發(fā)財,因此開設(shè)了“今日美國保守派”“唐納德·特朗普新聞”等100多個網(wǎng)站,發(fā)布純粹造假或嚴(yán)重?fù)郊僖怨袒x者偏見的新聞,如“教皇背書支持特朗普”“希拉里即將被定罪”“奧巴馬說非法移民可以投票”等高點擊量的假信息,并從谷歌和臉書廣告分成,賺得盆滿缽滿。
布達(dá)佩斯中央歐洲大學(xué)媒體、數(shù)據(jù)和社會中心主任馬里厄斯·德拉戈米爾(Marius Dragomir)指出,韋萊斯小鎮(zhèn)的造假模式能夠成功說明假新聞能夠貨幣化。美國著名傳媒專家羅伯特·麥克切斯尼(Robert McChesney)早就指出,市場的趨利性會傷害現(xiàn)有民主,眼里只有利潤的商業(yè)化媒介集團(tuán)一味迎合受眾終將帶來“極具破壞性、非理性的結(jié)果”。
虛假和真實的博弈
龐大的機(jī)器人賬號不僅會破壞商業(yè)模式,帶來不良的輿論影響,還難以清理和規(guī)制。比如,F(xiàn)acebook就頻繁受困于流量造假,自它上線的第一天開始,就有大量與之相關(guān)的麻煩與官司纏身。其中的邏輯很簡單,每一個體都能創(chuàng)建不止一個的臉書賬戶,當(dāng)某個賬戶被拉黑、屏蔽,用另外的名字重新開一個就好。對于個人來說都如此輕而易舉,換成機(jī)構(gòu)化的組織就更不用說。
由此帶來的是一場無止盡的貓鼠大戰(zhàn)。一個賬戶被查封了,另外一個賬戶又出現(xiàn)了。龐大的用戶數(shù)使臉書反欺詐團(tuán)隊頭痛不已。根據(jù)美國媒體Vox的報道,2019年的一季度,臉書總共刪除了22億個虛假賬號;2018年四季度,刪了12億個虛假賬號;2018年三季度,這個數(shù)字是75萬;而在2018年的第一季度,總共刪了不到60萬個虛假賬號。換言之,虛假賬號產(chǎn)生的速度是——60萬到75萬,75萬到12億,12億到22億。2019年,臉書一季度里刪掉的假賬號數(shù)量,已經(jīng)等同于其平臺一季度由真人注冊的真實賬號數(shù)量。
當(dāng)然,在這個過程中,也有研究團(tuán)隊嘗試開發(fā)檢測機(jī)器人賬號的工具。此前,印第安納大學(xué)伯明頓分校的研究人員就開發(fā)了一個“BotOrNot”工具,以檢測社交媒體上的機(jī)器人賬號。BotOrNot是Twitter公開的第一個檢測社交機(jī)器人的接口。該系統(tǒng)利用Twitter的搜索接口,收集待檢測賬號最近的200個帖子和最近被提及的100個帖子,從網(wǎng)絡(luò)、用戶、好友、時間、內(nèi)容和情感等6類特征入手,判斷該賬號屬于惡意機(jī)器人的可能性,經(jīng)過十折交叉驗證后發(fā)現(xiàn)隨機(jī)森林模型的分類效果最好。
通過BotOrNot,研究人員分析了2016年5月至2017年5月推特用戶分享的1 400萬條信息,包括關(guān)于美國總統(tǒng)初選和特朗普就職典禮的信息。結(jié)果發(fā)現(xiàn),圍繞2016年美國總統(tǒng)大選的很大一部分話題都是機(jī)器人制造的。實際上,僅用6%的被確認(rèn)為機(jī)器人的推特賬戶,就能在推特上傳播31%的低可信度的信息。機(jī)器人賬號只需要2~10秒就能完成這些事情。當(dāng)?shù)涂尚哦刃畔⑴c可靠來源信息混到一起時,人們就很難對其加以辨別。這一研究成果后來被發(fā)表在《自然通訊》(Nature Communications)雜志上。
此外,樸素貝葉斯算法、K近鄰算法、C4.5決策樹、支持向量機(jī)、隨機(jī)森林算法等都已被用于識別社交機(jī)器人。此前,也有研究人員選取發(fā)文內(nèi)容、發(fā)文數(shù)量、粉絲和好友數(shù)量、推文來源、用戶注冊時間、地理位置信息等7個特征,使用樸素貝葉斯的方法對Twitter上真實用戶和星球大戰(zhàn)僵尸機(jī)器人進(jìn)行研究,發(fā)現(xiàn)機(jī)器人賬戶與真實用戶在地理距離和連接屬性上呈現(xiàn)明顯差異,真實用戶的推文數(shù)據(jù)呈冪率分布,而機(jī)器人呈現(xiàn)出均勻分布的特征。
還有研究人員提出了多種檢測網(wǎng)絡(luò)水軍的算法,包括基于黑名單的算法、基于用戶特征的算法以及基于文本的方法等。
今天,機(jī)器人賬號都已經(jīng)無可避米地滲透在我們的網(wǎng)絡(luò)生活中,這是數(shù)據(jù)的時代,也是虛假盛行的時代,分辨這一切的虛假與真實,我們還有很長的路要走。(本文首發(fā)鈦媒體APP)
關(guān)鍵詞: