龐大的機(jī)器人賬號背后,藏著什么生意經(jīng)?

機(jī)器人賬號其實(shí)就是一種能夠在社交網(wǎng)絡(luò)上接收指令并模仿正常人類用戶行為的智能程序。并且,隨著人工智能的發(fā)展,從創(chuàng)建應(yīng)用軟件、官方網(wǎng)站或內(nèi)容傳播平臺,到生產(chǎn)具有實(shí)質(zhì)性內(nèi)容的圖像、視頻或文字,通過或真或假或自動地與用戶交互,今天,機(jī)器人賬號已經(jīng)越來越“真實(shí)”。

本文來自微信公眾號“根新未來”。

今天,我們的生活已經(jīng)很難再脫離網(wǎng)絡(luò)。雖然互聯(lián)網(wǎng)給我們帶來了前所未有的巨量信息,但這些信息卻并不都是真實(shí)和有用的信息。事實(shí)上,今天的互聯(lián)網(wǎng)中,有大量的機(jī)器人賬號存在。機(jī)器人賬號由算法來模仿人類的行為習(xí)慣進(jìn)行操控,不需要真人的參與就可以自動完成發(fā)帖、評論和轉(zhuǎn)發(fā)。

雖然大部分人并不了解甚至不知道機(jī)器人賬號的存在,但機(jī)器人賬號已經(jīng)成為影響輿論和干擾數(shù)據(jù)的重要因素。那么,機(jī)器人賬號到底為何而存在?又該如何被管理?除了造成虛假的信息泛濫,機(jī)器人賬號還有沒有其他用途?

360截圖16251112669372.png

龐大的機(jī)器人賬號

機(jī)器人賬號其實(shí)就是一種能夠在社交網(wǎng)絡(luò)上接收指令并模仿正常人類用戶行為的智能程序。并且,隨著人工智能的發(fā)展,從創(chuàng)建應(yīng)用軟件、官方網(wǎng)站或內(nèi)容傳播平臺,到生產(chǎn)具有實(shí)質(zhì)性內(nèi)容的圖像、視頻或文字,通過或真或假或自動地與用戶交互,今天,機(jī)器人賬號已經(jīng)越來越“真實(shí)”。

作為能模仿正常人類用戶行為的智能程序,機(jī)器人賬號最大的特點(diǎn),就是龐大。早在2017年,就有研究人員報(bào)告了其發(fā)現(xiàn)的一個(gè)Twitter僵尸網(wǎng)絡(luò),其中包含超過35萬個(gè)機(jī)器人帳戶。這是一個(gè)具有難以想象比例的網(wǎng)絡(luò),它自2013年誕生以來就一直未被發(fā)現(xiàn)。

同年,來自美國馬里蘭州的網(wǎng)絡(luò)安全公司ZeroFOX公布了一份研究報(bào)告,揭開了Twitter平臺大規(guī)模垃圾色情郵件僵尸網(wǎng)絡(luò)的冰山一角:根據(jù)報(bào)告,被ZeroFOX定點(diǎn)追蹤、被稱為“SIREN”的Twitter僵尸網(wǎng)絡(luò),包含超過90000個(gè)偽造的賬號,總計(jì)發(fā)布了超過850萬條包含惡意鏈接的推文。這些內(nèi)容僅在調(diào)查結(jié)束前的數(shù)周之內(nèi),就產(chǎn)生了超過3000萬次的推特用戶點(diǎn)擊。

中文網(wǎng)絡(luò)輿論場的網(wǎng)絡(luò)水軍問題也很突出。打開手機(jī),我們在社交媒體上收到的評論與轉(zhuǎn)發(fā),在問答平臺上看到的點(diǎn)贊和收藏,微博時(shí)常莫名的關(guān)注,和直播營銷好看的數(shù)據(jù),這些與我們展開互動的陌生ID和互聯(lián)網(wǎng)呈現(xiàn)給我們的數(shù)字現(xiàn)象,背后的控制者,很可能就是機(jī)器人賬號。

微博大V動輒坐擁數(shù)千萬粉絲,其真實(shí)性也很可疑。曾有“一找照妖鏡”網(wǎng)站專查“活粉”比例,大V們近80%的粉絲都是僵尸粉。新浪微博里首個(gè)突破一億粉絲的女藝人,我們不會真的相信是有一億個(gè)人關(guān)注了她;百分百好評的商品,消費(fèi)者也會對其持有懷疑;事實(shí)上,批量生產(chǎn)的機(jī)器人賬號,流量造假的媒介狂歡,早已在中文社交網(wǎng)絡(luò)上泛濫成災(zāi)。

龐大的的機(jī)器人賬號背后,其實(shí)是產(chǎn)業(yè)鏈的發(fā)展。2018年1月,《紐約時(shí)報(bào)》刊發(fā)調(diào)查報(bào)道,就揭秘了美國的“僵尸粉制造工廠”。一家名為Devumi的公司在社交媒體上通過“造粉”和“賣粉”賺了上千萬美元。而Devumi生產(chǎn)僵尸粉的流程就在于,先“復(fù)制”一批真實(shí)存在的網(wǎng)絡(luò)用戶的照片、資料和賬戶細(xì)節(jié)等,把它們做成“機(jī)器人粉絲”,然后賣給演員、企業(yè)家、政治評論員等“想出名或是想在互聯(lián)網(wǎng)上施加影響力的人”。此外,Devumi還提供轉(zhuǎn)發(fā)、點(diǎn)贊等服務(wù)。

這家“地下工廠”共造了350萬個(gè)僵尸粉,而且每個(gè)僵尸粉都被多次買賣,累計(jì)起來提供的“假粉絲”數(shù)量超過兩億。Devumi不僅在推特上,還在拼趣(Pinterest)、領(lǐng)英和優(yōu)兔等網(wǎng)站上開展生意。

360截圖16251112669372.png

機(jī)器人賬號背后的生意經(jīng)

機(jī)器人賬號之所以能夠催生出像Devumi一樣的公司,根本上還是利益導(dǎo)向的結(jié)果。如今的互聯(lián)網(wǎng)已經(jīng)變身一個(gè)“唯流量”時(shí)代,流量在哪里,就以為著關(guān)注點(diǎn)在哪里,大家就認(rèn)為市場在哪里。

傳統(tǒng)媒體時(shí)代,主要的流量造假者大多來自傳統(tǒng)媒體,報(bào)紙夸大發(fā)行量、廣電對于收視聽率的調(diào)查樣本進(jìn)行污染的情況時(shí)有發(fā)生?;ヂ?lián)網(wǎng)時(shí)代,電商等新消費(fèi)形態(tài)逐漸普及,對于轉(zhuǎn)化率等數(shù)據(jù)第一次有了網(wǎng)絡(luò)采集與對照的可能,流量造假就有了更強(qiáng)烈的需求驅(qū)動,點(diǎn)擊率等指標(biāo)被注水成為常態(tài)。

這是數(shù)據(jù)的時(shí)代,也是虛假盛行的時(shí)代。機(jī)器人賬號造成的大量信息,不僅讓虛假蔓延在互聯(lián)網(wǎng)領(lǐng)域,基于機(jī)器人賬號的流量造假、流量劫持,還會破壞商業(yè)模式,損害數(shù)據(jù)信息價(jià)值,造成大數(shù)據(jù)產(chǎn)業(yè)“劣幣驅(qū)逐良幣”。為了追求自身的利益最大化的流量造假,也違背了誠信的原則。而當(dāng)數(shù)據(jù)造假成為一種產(chǎn)業(yè),每個(gè)參與其中的人都因自身獲利而或多或少助長了造假現(xiàn)象的持續(xù)蔓延。

此外,機(jī)器人賬號也被廣泛用于操縱輿論,而其背后往往是為了某一利益集團(tuán)服務(wù)。在影響輿論方面,2018年麻省理工學(xué)院的研究團(tuán)隊(duì),通過對Twitter輿論事件話題下的發(fā)言進(jìn)行歸納分析,得出一個(gè)驚人的結(jié)論:只要保證充足的活躍度,哪怕實(shí)際數(shù)量還不到參與用戶總數(shù)的1%,Twitter上的機(jī)器人賬號,依舊能夠影響輿論的風(fēng)向走勢。

這項(xiàng)研究的樣本輿論事件,正是2016年的美國總統(tǒng)大選。通過對收集到的77563個(gè)用戶樣本展開分析,麻省理工學(xué)院的研究者篩選出了7702個(gè)不會改變立場的頑固用戶;隨后經(jīng)過進(jìn)一步篩選,總共鎖定了396個(gè)僵尸賬戶——260個(gè)支持特朗普,136個(gè)支持希拉里,加在一起不到用戶樣本總數(shù)的5%。

盡管占比不高,但憑借遠(yuǎn)超真人用戶的活躍度,這400個(gè)僵尸賬戶扮演的“意見領(lǐng)袖”,成功將雙方候選人的觀點(diǎn)推向極端化,為兩邊吸引了數(shù)量可觀的真實(shí)支持者,最終實(shí)現(xiàn)了微妙的“平分秋色”。

而輿論操縱背后,有研究顯示,有100多個(gè)支持特朗普的偽造網(wǎng)站都來自遠(yuǎn)在南歐巴爾干半島馬其頓的韋萊斯小鎮(zhèn),鎮(zhèn)上的年輕人想趁美國大選發(fā)財(cái),因此開設(shè)了“今日美國保守派”“唐納德·特朗普新聞”等100多個(gè)網(wǎng)站,發(fā)布純粹造假或嚴(yán)重?fù)郊僖怨袒x者偏見的新聞,如“教皇背書支持特朗普”“希拉里即將被定罪”“奧巴馬說非法移民可以投票”等高點(diǎn)擊量的假信息,并從谷歌和臉書廣告分成,賺得盆滿缽滿。

布達(dá)佩斯中央歐洲大學(xué)媒體、數(shù)據(jù)和社會中心主任馬里厄斯·德拉戈米爾(Marius Dragomir)指出,韋萊斯小鎮(zhèn)的造假模式能夠成功說明假新聞能夠貨幣化。美國著名傳媒專家羅伯特·麥克切斯尼(Robert McChesney)早就指出,市場的趨利性會傷害現(xiàn)有民主,眼里只有利潤的商業(yè)化媒介集團(tuán)一味迎合受眾終將帶來“極具破壞性、非理性的結(jié)果”。

360截圖16251112669372.png

虛假和真實(shí)的博弈

龐大的機(jī)器人賬號不僅會破壞商業(yè)模式,帶來不良的輿論影響,還難以清理和規(guī)制。比如,F(xiàn)acebook就頻繁受困于流量造假,自它上線的第一天開始,就有大量與之相關(guān)的麻煩與官司纏身。其中的邏輯很簡單,每一個(gè)體都能創(chuàng)建不止一個(gè)的臉書賬戶,當(dāng)某個(gè)賬戶被拉黑、屏蔽,用另外的名字重新開一個(gè)就好。對于個(gè)人來說都如此輕而易舉,換成機(jī)構(gòu)化的組織就更不用說。

由此帶來的是一場無止盡的貓鼠大戰(zhàn)。一個(gè)賬戶被查封了,另外一個(gè)賬戶又出現(xiàn)了。龐大的用戶數(shù)使臉書反欺詐團(tuán)隊(duì)頭痛不已。根據(jù)美國媒體Vox的報(bào)道,2019年的一季度,臉書總共刪除了22億個(gè)虛假賬號;2018年四季度,刪了12億個(gè)虛假賬號;2018年三季度,這個(gè)數(shù)字是75萬;而在2018年的第一季度,總共刪了不到60萬個(gè)虛假賬號。換言之,虛假賬號產(chǎn)生的速度是——60萬到75萬,75萬到12億,12億到22億。2019年,臉書一季度里刪掉的假賬號數(shù)量,已經(jīng)等同于其平臺一季度由真人注冊的真實(shí)賬號數(shù)量。

當(dāng)然,在這個(gè)過程中,也有研究團(tuán)隊(duì)嘗試開發(fā)檢測機(jī)器人賬號的工具。此前,印第安納大學(xué)伯明頓分校的研究人員就開發(fā)了一個(gè)“BotOrNot”工具,以檢測社交媒體上的機(jī)器人賬號。BotOrNot是Twitter公開的第一個(gè)檢測社交機(jī)器人的接口。該系統(tǒng)利用Twitter的搜索接口,收集待檢測賬號最近的200個(gè)帖子和最近被提及的100個(gè)帖子,從網(wǎng)絡(luò)、用戶、好友、時(shí)間、內(nèi)容和情感等6類特征入手,判斷該賬號屬于惡意機(jī)器人的可能性,經(jīng)過十折交叉驗(yàn)證后發(fā)現(xiàn)隨機(jī)森林模型的分類效果最好。

通過BotOrNot,研究人員分析了2016年5月至2017年5月推特用戶分享的1 400萬條信息,包括關(guān)于美國總統(tǒng)初選和特朗普就職典禮的信息。結(jié)果發(fā)現(xiàn),圍繞2016年美國總統(tǒng)大選的很大一部分話題都是機(jī)器人制造的。實(shí)際上,僅用6%的被確認(rèn)為機(jī)器人的推特賬戶,就能在推特上傳播31%的低可信度的信息。機(jī)器人賬號只需要2~10秒就能完成這些事情。當(dāng)?shù)涂尚哦刃畔⑴c可靠來源信息混到一起時(shí),人們就很難對其加以辨別。這一研究成果后來被發(fā)表在《自然通訊》(Nature Communications)雜志上。

此外,樸素貝葉斯算法、K近鄰算法、C4.5決策樹、支持向量機(jī)、隨機(jī)森林算法等都已被用于識別社交機(jī)器人。此前,也有研究人員選取發(fā)文內(nèi)容、發(fā)文數(shù)量、粉絲和好友數(shù)量、推文來源、用戶注冊時(shí)間、地理位置信息等7個(gè)特征,使用樸素貝葉斯的方法對Twitter上真實(shí)用戶和星球大戰(zhàn)僵尸機(jī)器人進(jìn)行研究,發(fā)現(xiàn)機(jī)器人賬戶與真實(shí)用戶在地理距離和連接屬性上呈現(xiàn)明顯差異,真實(shí)用戶的推文數(shù)據(jù)呈冪率分布,而機(jī)器人呈現(xiàn)出均勻分布的特征。

還有研究人員提出了多種檢測網(wǎng)絡(luò)水軍的算法,包括基于黑名單的算法、基于用戶特征的算法以及基于文本的方法等。

今天,機(jī)器人賬號都已經(jīng)無可避米地滲透在我們的網(wǎng)絡(luò)生活中,這是數(shù)據(jù)的時(shí)代,也是虛假盛行的時(shí)代,分辨這一切的虛假與真實(shí),我們還有很長的路要走。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論