流水的數(shù)字內(nèi)容,鐵打的內(nèi)容風控

隨著技術(shù)發(fā)展,黑灰產(chǎn)數(shù)字內(nèi)容,從生產(chǎn)到偽造的手段也越來越高——從零幾年的發(fā)帖機,到現(xiàn)在的智能語音生成、智能圖像偽造,甚至視頻換臉等,增加了內(nèi)容風控難度和成本。

2345截圖20220818151609.png

本文來自品途商業(yè)評論,文/曾響鈴。

草莽紛爭之后,數(shù)字內(nèi)容平臺如何走遠?

很可能像被「十二道金牌」追回的岳飛,扼腕長嘆的那樣——十年之力,廢于一旦。

岳飛的十年勝利,毀于奸臣之手,可恨可嘆,無可避免。

但在互聯(lián)網(wǎng)合規(guī)化大潮下,互聯(lián)網(wǎng)內(nèi)容平臺的「十年勝利」,如果毀于「內(nèi)容風控不力」,不僅可惜,更是可悲。因為,這本可以避免。

8月3日,國家計算機病毒應急處理中心(以下簡稱「應急中心」)新通報一批違規(guī)移動APP名單,包括《新浪金融》《覓上》《海豚家》等在內(nèi)的17款APP「榜上有名」。

據(jù)了解,這離應急中心通報上一批違規(guī)APP尚不足月,而這已經(jīng)是2022年以來的第12次通報。

在互聯(lián)網(wǎng)內(nèi)容合規(guī)化大潮下,守護網(wǎng)絡內(nèi)容安全的這「十二道金牌」,告訴我們,在當下數(shù)字內(nèi)容風控的重要性和緊迫性,毋庸多言。

流水的數(shù)字內(nèi)容

數(shù)字內(nèi)容如「流水」,有幾大特征。

首先,數(shù)字內(nèi)容如流水般,沒有常形,很難捉摸,導致數(shù)字內(nèi)容風控難度隨之變大。

從最開始的圖文,到后面的語音、視頻內(nèi)容,可以看到數(shù)字內(nèi)容這種「因器變而形變、因物異而適其異」的特性。

而隨著技術(shù)發(fā)展,黑灰產(chǎn)數(shù)字內(nèi)容,從生產(chǎn)到偽造的手段也越來越高——從零幾年的發(fā)帖機,到現(xiàn)在的智能語音生成、智能圖像偽造,甚至視頻換臉等,增加了內(nèi)容風控難度和成本。

其次,相較傳統(tǒng)印刷內(nèi)容,數(shù)字內(nèi)容生產(chǎn)規(guī)模大、增速快,且能夠在互聯(lián)網(wǎng)快速流動、擴散和滲透,控制不當,「流水」就會變成「洪水」。這也就意味著,數(shù)字內(nèi)容風控從人力密集型(人工審核)進入到計算密集型。

數(shù)據(jù)顯示,人類進入互聯(lián)網(wǎng)前的5000年,文字記載內(nèi)容總共為5艾(1艾字節(jié)=1,152,921,504,606,846,976字節(jié))。但僅2006年,全球全年產(chǎn)生的數(shù)字內(nèi)容,就超過280艾。

近年來,在「高清、三維、視頻化、用戶創(chuàng)造內(nèi)容(UGC)」的驅(qū)動下,數(shù)字內(nèi)容進一步爆發(fā),宛如「洪水」。2018年到2020年,中國數(shù)字內(nèi)容產(chǎn)業(yè)年復合增長率高達9.33%,超過同期中國生產(chǎn)總值。數(shù)字內(nèi)容審核,已非單憑人力就能勝任的時代。

最后,技術(shù)與產(chǎn)業(yè)發(fā)展,助推數(shù)字內(nèi)容空前豐富,讓數(shù)字內(nèi)容成為數(shù)字經(jīng)濟的「富礦」,同時也成為黑灰產(chǎn)眼中的「肥肉」,數(shù)字內(nèi)容風控呈現(xiàn)出24小時不間斷的「長期強對抗」態(tài)勢。

數(shù)字內(nèi)容的時代洪流,沖刷出一條條大江、大河,催生出諸如抖音、快手等互聯(lián)網(wǎng)巨頭企業(yè)。同時,也在不斷沖刷網(wǎng)絡內(nèi)容安全的河堤,且平臺勢能越強,帶來的內(nèi)容安全隱患也就越大。數(shù)字內(nèi)容平臺,如果成了被利用的「間接作惡工具」,將給企業(yè)正常運營帶來麻煩和損失。

今年4月-7月,在為期三個月的「清朗·整治網(wǎng)絡直播、短視頻領(lǐng)域亂象」中,106個直播短視頻平臺下架關(guān)停,快手、嗶哩嗶哩、虎牙等被約談、罰款,抖音、淘寶、微信視頻號等16家重點直播、短視頻平臺上,56.3萬個違規(guī)直播間被處置,235.1萬條違規(guī)短視頻被清理,12萬個違規(guī)用戶賬號被關(guān)閉......

來自新一代數(shù)字內(nèi)容風控服務商網(wǎng)易易盾的數(shù)據(jù)顯示,成立六年來,網(wǎng)易易盾終端覆蓋量超25億,累計檢測數(shù)據(jù)量超2萬億,處理移動安全風險超1400億,抵御外掛超威脅700億......

可見,數(shù)字內(nèi)容風控依然任重道遠。而隨著內(nèi)容平臺對數(shù)字內(nèi)容風控逐漸重視,相關(guān)需求正在不斷上升。數(shù)字內(nèi)容平臺發(fā)展,如何做到內(nèi)容「不失控」,已事關(guān)企業(yè)生死存亡。

鐵打的內(nèi)容風控

不管是將一匙酒倒進一桶污水,還是把一匙污水倒進一桶酒里,得到的最終都是一桶污水,這就是管理學上著名的「酒與污水定律」。

可見,污水和酒的比例不決定這桶東西的性質(zhì),起作用的是那一勺污水,有它在,再多的酒都會成為污水。

這跟內(nèi)容風控一樣。對數(shù)字內(nèi)容平臺來說,即使它有一萬條優(yōu)質(zhì)內(nèi)容,但只要有違規(guī)內(nèi)容,它就可能面臨處罰、下架乃至關(guān)停的風險。

國家應急中心2022年1-7月的12次通報已經(jīng)敲鐘——內(nèi)容風控將會越來越重要,內(nèi)容平臺因數(shù)字內(nèi)容獲益,理應承擔更多的內(nèi)容治理責任,背后邏輯很好理解。

一方面,就企業(yè)來說,企業(yè)存在的最大價值,是解決社會問題,而非制造社會問題。數(shù)字內(nèi)容平臺,過去幾年的發(fā)展解決了很多社會問題,這為其帶來了商家。

不過,一些平臺也存在大量「色、丑、怪、假、俗、賭」等違規(guī)內(nèi)容,則給其帶來危機。這些內(nèi)容不但對平臺發(fā)展無益,會造成用戶體驗下降、用戶流失、平臺聲譽受損,同時也會嚴重威脅平臺用戶的切身利益,甚至引發(fā)社會問題,影響企業(yè)發(fā)展。

另一方面,對各大行業(yè)來說,隨著數(shù)字化轉(zhuǎn)型深化,數(shù)字經(jīng)濟如火如荼,數(shù)字內(nèi)容和數(shù)字內(nèi)容風控未來將成為企業(yè)標配——數(shù)字內(nèi)容如潮,一波接一波,但不管后續(xù)形式、平臺如何發(fā)展與進化,內(nèi)容風控將是企業(yè)遠航的「壓艙石」,也是內(nèi)容平臺「鐵打的營盤」。

但數(shù)字內(nèi)容風控,并非一蹴而就,而是一場實時強對抗、長鏈條立體式的長期戰(zhàn),需要大量的人力和技術(shù)投入,任何一環(huán)掉鏈子都可能導致前功盡棄。

簡單來講,數(shù)字內(nèi)容風控涵蓋用戶使用全生命周期,包括使用前的用戶賬戶注冊(避免垃圾注冊)、使用中內(nèi)容智能識別與安全檢測(避免使用中體驗和用戶權(quán)益受影響),比如社交反欺詐、游戲反外掛以及營銷反作弊等,以及抵擋無時無刻可能存在,來自網(wǎng)絡各個角度對應用的攻擊等,這從第三方安全風控公司網(wǎng)易易盾提供的數(shù)字內(nèi)容安全解決方案中,也能感受到數(shù)字內(nèi)容風控需要「面面俱到」。

2345截圖20220818151609.png

(△網(wǎng)易易盾數(shù)字內(nèi)容安全解決方案)

這就意味著,不管從成本還是技術(shù)上來看,僅靠單一內(nèi)容平臺很難內(nèi)部消化。因此第三方安全廠商、安全風控公司正在成為企業(yè)保駕護航的新剛需。這從網(wǎng)易易盾服務的「朋友圈」越來越大也能得到佐證。目前,網(wǎng)易易盾已服務數(shù)千家行業(yè)頭部企業(yè),其中不乏人民網(wǎng)、外交部、中信證券、小米、vivo、愛奇藝、知乎、B站、TapTap、中手游等知名企事業(yè)單位,服務間接覆蓋99%以上網(wǎng)民。

數(shù)字內(nèi)容風控,也早在2018年就成為市場空間超百億的行業(yè)。安全行業(yè)體系標準建設(shè)也在持續(xù)推進,安全策略運營更是成為新職業(yè)——由網(wǎng)易易盾參與起草的《網(wǎng)絡與信息安全管理員國家職業(yè)技能標準》已于2020年正式發(fā)布,這也為行業(yè)培養(yǎng)安全策略運營人員提供了支撐。

內(nèi)容平臺如何「風控」免「封控」?

顯而易見,互聯(lián)網(wǎng)內(nèi)容平臺正在進入「少犯錯即成功」的時代,內(nèi)容平臺如何風控避免封控,需要認識到數(shù)字內(nèi)容風控的幾大特點。

第一,門檻看似低,其實非常高。技術(shù)需要持續(xù)迭代,場景非標性強,需要大數(shù)據(jù)支撐。

基于上述特征,數(shù)字內(nèi)容風控也有較強的規(guī)模效應,未來主流發(fā)展趨勢,只能是大平臺化作戰(zhàn),而非企業(yè)獨自為戰(zhàn)。即數(shù)字風控服務商需要「見多識廣」。

就像飛書誕生于抖音集團(原字節(jié)跳動)內(nèi)部OKR應用;釘釘誕生于阿里內(nèi)部協(xié)作;網(wǎng)易易盾的誕生,也離不開網(wǎng)易多元互聯(lián)網(wǎng)業(yè)務的「喂養(yǎng)」。

網(wǎng)易從提供博客、郵件類產(chǎn)品開始即重視內(nèi)容風控,且其業(yè)務所涉的游戲、電商、社交、娛樂等都需要內(nèi)容風控。這些內(nèi)部需求和實踐,讓網(wǎng)易擁有20多年數(shù)據(jù)積累,也讓網(wǎng)易易盾在內(nèi)容風控上「見多識廣」。

這些,又為網(wǎng)易易盾算法團隊沉淀出一系列高效率的場景化數(shù)據(jù)精煉流程和算法訓練方案。構(gòu)建了數(shù)百種細分類識別的模型,最高99.99%的分類模型精準度,持續(xù)獲得包括浙江省科學技術(shù)進步獎一等獎在內(nèi)的各類官方權(quán)威認可。

第二,要么不出事,要么出大事,試錯成本高,穩(wěn)定性高于一切。

數(shù)字內(nèi)容風控事故只有0和1的區(qū)別,企業(yè)不能存在僥幸心理,也不能充當「小白鼠」,因為一次事故,可能就會打斷企業(yè)發(fā)展的勢頭,甚至將多年積累毀于一旦。

2019年7月底,處于快速增長期的小紅書突然「被下架」,整改后時隔70多天方才重新上架,元氣大傷——2019年下架前的6月,小紅書月活約為9300萬,到9月底月活用戶降為7288萬。這樣的例子很多,此外還有像抖音集團(原字節(jié)跳動)旗下因內(nèi)容被關(guān)停的「內(nèi)涵段子」們也不少。

因此,選擇一個被驗證過的內(nèi)容風控服務商很重要。被網(wǎng)易內(nèi)部從郵件、博客到社交娛樂、游戲、購物驗證過的網(wǎng)易易盾,被上千行業(yè)頭部企業(yè)「拿去就用」也就不奇怪了,這跟釘釘和飛書被別的企業(yè)「拿去用」是一樣的道理。

第三,數(shù)字內(nèi)容風控是一場持久戰(zhàn),貫穿企業(yè)全生命周期,需要全方位、持續(xù)改善,包括人工審核、機器識別和安全策略三方面,一個環(huán)節(jié)都不能少。

目前第三方內(nèi)容風控服務商標配是「機器識別+人工審核」。其中「機器識別」承擔「將識別能力標準化」的部分,即基于深度學習及大規(guī)模樣本訓練,對內(nèi)容進行分析,分辨其中可能存在的色情、低俗、廣告、涉政、暴恐、謾罵、灌水等可能性的內(nèi)容,進行標紅和分類預處理,最后交由「人工審核」來負責定性的部分。

還有少數(shù)服務商提供的是「機器識別+人工審核+安全策略」服務,業(yè)內(nèi)較早做的是網(wǎng)易易盾。其提供的「安全策略」可以類比為「機器識別」與「人工審核」之間的橋梁,既幫人工團隊將其處理的特征和知識,抽象出來反哺給機器,讓機器識別更"聰明";又根據(jù)通用問題,開發(fā)一些策略工具持續(xù)篩選機器識別后的數(shù)據(jù),使其結(jié)果輸出更精準。

由于做得比較早(2012年內(nèi)部開發(fā),2016年開始對外服務,在2019年網(wǎng)易易盾該方案已成為行業(yè)通用解決方案),相比其它企業(yè),網(wǎng)易易盾是少數(shù)擁有「策略運營團隊」的內(nèi)容風控服務商,相比市場上普遍的「機器+人工」模式,網(wǎng)易易盾補足了「運營」這個重要環(huán)節(jié),成為能提供一站式全生命周期的專業(yè)數(shù)字內(nèi)容風控服務的「少數(shù)派」。

總而言之,數(shù)字內(nèi)容風控,就像內(nèi)容平臺參與的一場特殊的足球賽,你可以自己不得分,但你不能失守,被對方破門。否則不管是1:0還是100:0,結(jié)局都是輸!而平臺從內(nèi)容風控到「被封控」,很大程度上取決于一個「守門員」。

*本文圖片均來源于網(wǎng)絡

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論