前沿 | 從生產要素角度看數據安全保護存在的問題

中國信息安全
陳錦
數據作為新型生產要素參與社會生產過程,需要從一個系統(tǒng)流動到另一個系統(tǒng),從一個網絡區(qū)域流動到另一個網絡區(qū)域,從一個組織流動到另一個組織。數據流動是實現價值增值的前提和基礎。

2020年4月9日,中共中央、國務院發(fā)布《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》,提出“土地、勞動力、資本、技術和數據”五個要素領域改革方向,明確數據已經成為新的生產要素,參與到社會生產生活各環(huán)節(jié)。數據通過動態(tài)流動創(chuàng)造價值、提高政府治理能力,同時也面臨數據竊取、數據泄露、個人隱私安全等問題。為了保障作為生產要素的數據安全,需要正確理解認識數據特性,把握數據安全特點,建設以數據為中心的安全保障體系,切實保障數據參與生產過程各環(huán)節(jié)安全。

一、概述

1.數據特性

在大數據時代,數據參與社會生產過程,實現價值增值,是一種新型生產要素,具有以下特性:

(1)增值性。在大數據時代,數據可以通過分析挖掘等手段產生新的數據,挖掘新的信息和情報,生成新的數據產品,形成新的數據業(yè)務,實現價值的增加。

(2)流動性。數據作為新型生產要素參與社會生產過程,需要從一個系統(tǒng)流動到另一個系統(tǒng),從一個網絡區(qū)域流動到另一個網絡區(qū)域,從一個組織流動到另一個組織。數據流動是實現價值增值的前提和基礎。

(3)復雜的權屬性。在大數據時代,除了數據擁有者,還有數據主體、數據提供者和數據消費者等角色,不同角色擁有數據的不同權益,如數據主體對數據擁有訪問權、更正權和遺忘權等。

2.數據安全特點

由于數據具有增值性、流動性和復雜的權屬性等特性,在數據安全保護方面具有以下特點:

(1)嚴格的合規(guī)要求。國內外新增了一系列數據安全保護法律法規(guī)和標準規(guī)范,針對數據安全保護提出嚴格要求。如歐盟的《通用數據保護條例》,我國的《網絡安全法》《數據安全法(草案)》和《信息安全技術個人信息安全規(guī)范》(GB/T 35273-2017)等。同時,保護范圍覆蓋全面,涵蓋數據采集、存儲、使用、發(fā)布、共享、離境等全生命周期和用戶權利保護等內容。

(2)開放的應用環(huán)境。作為生產要素的數據,為了實現增值目標,需要通過API接口與第三方系統(tǒng)交換共享數據,增加了數據暴露面,相對處于更加開放的環(huán)境。

(3)復雜的應用場景。數據在參與生產過程中,存在數據在組織內部進行匯聚融合、向監(jiān)管單位提供數據、與第三方交換共享數據、數據服務外包、數據跨境傳輸等應用場景,不同的應用場景可能帶來新的安全風險,增加了數據安全保護的難度。

(4)多維的關聯分析。不同來源、不同類別的數據匯聚融合后,可以從多個維度對數據進行關聯分析,產生新的、更有價值的數據。這些新產生的數據在帶來新的價值的同時,也可能產生未知安全風險,如泄露個人隱私、組織秘密和國家機密等。

二、數據安全保護面臨的問題

根據數據安全具有的特點,從認知觀念、標準規(guī)范和生產過程等方面對數據安全保護面臨的問題進行分析。

1.對數據安全的認知觀念存在誤區(qū)

目前,對數據安全的認知存在誤區(qū),主要體現在以下幾個方面:(1)數據安全保護理念落后。認為傳統(tǒng)的信息安全保障思路仍然能夠解決目前數據安全遇到的問題,忽視了數據是新型生產要素,沒有把握住數據動態(tài)流動等特點,缺乏以數據為中心的安全保護理念。(2)窄化數據安全保護目標。認為數據安全保護就是保障數據機密性、完整性和可用性,忽視了數據具有權屬性,保護數據相關角色的權益也是數據安全保護的目標之一。(3)簡化數據安全保護手段。認為數據安全保護就是區(qū)域邊界防護,只需在區(qū)域邊界采取身份鑒別、訪問控制、安全審計等技術手段,忽視了數據具有流動性,在流動過程中更需要通過數據脫敏、數據溯源分析、數據安全持續(xù)風險監(jiān)測等技術手段。

2.數據安全相關的標準規(guī)范不健全

由于數據安全事件頻發(fā),為了控制數據安全風險,保護個人的合法權益,維護國家安全,我國十分重視數據安全立法工作。在《網絡安全法》中提出了“國家鼓勵開發(fā)網絡數據安全保護和利用技術”“防止網絡數據泄露或被竊取、篡改”等要求;在《數據安全法(草案)》中提出了“國家對數據實行分級分類保護”“開展數據活動必須履行數據安全保護義務,承擔社會責任”等,具體包括建立健全數據安全治理體系,建立數據安全風險評估、數據安全應急處置機制,建立數據安全審查等數據安全管理制度,實現數據自由安全流動。在《全球數據安全倡議》中呼吁各國秉持發(fā)展和安全并重的原則,平衡處理技術進步、經濟發(fā)展與保護國家安全和社會公共利益的關系。但是,目前缺乏與《數據安全法(草案)》《全球數據安全倡議》等配套的實施細則與標準規(guī)范,數據安全保護工作難以達到預期效果。

3.數據參與生產過程帶來安全風險

由于數據具有流動性等特性,數據安全具有嚴格的合規(guī)要求、開放的應用環(huán)境和復雜的應用場景等特點,數據在存儲訪問、分析挖掘、開放共享、交易流通和數據產品使用等生產過程中存在一定的安全風險。

(1)存儲訪問過程安全風險

由于數據具有海量規(guī)模,存儲數據的平臺以分布式大數據系統(tǒng)為主。當前,建設大數據系統(tǒng)主要采用基于開源產品搭建、開源產品二次封裝、采購國外產品等方式。以上三種模式的核心還是離不開開源產品和國外產品,關鍵技術不能安全可控,數據在存儲和訪問過程中面臨數據泄露風險。根據國家漏洞庫(CNNVD)統(tǒng)計數據顯示,截至今年9月底,Hadoop存在權限控制、輸入驗證、目錄遍歷、信息泄露等27個漏洞,Spark存在權限控制、跨站腳本等45個漏洞,MongoDB存在訪問控制等26個漏洞。因安全漏洞導致大量數據丟失和數據泄露,如2019年5月,MongoDB因安全漏洞導致超過1.2萬個數據庫被攻擊者刪除。2020年9月,微軟的Elasticsearch數據庫因存在身份認證缺陷,數據庫直接暴露在互聯網上,導致1億多條數據泄露。

(2)分析挖掘過程安全風險

在分析挖掘過程中存在以下安全問題:1)泄露用戶隱私信息。通過知識挖掘、機器學習、人工智能等技術,將過去分離的信息進行關聯、碰撞和整合,可以重新刻畫用戶的興趣愛好、政治傾向和人格特征等,使原始數據中被隱藏的信息再次顯現出來,甚至分析挖掘后得到的信息遠遠大于原始數據所擁有的信息;2)人工智能技術帶來數據安全問題。因人工智能學習框架和組件存在安全漏洞,導致訓練數據存在竊取和泄露風險。某安全團隊在一個月的時間里發(fā)現了數十個深度學習框架及其依賴庫存在內存訪問越界、空指針引用、整數溢出、除零異常等漏洞,使深度學習應用存在數據泄露、數據污染等安全風險。3)數據濫用。數據分析人員在開展業(yè)務的過程中,沒有嚴格按照業(yè)務目標和業(yè)務要求進行數據分析和挖掘,基于授權的數據進行違規(guī)操作,開展與業(yè)務目標不相關的分析挖掘,導致用戶隱私泄露。如某電子商務網站要求基于用戶的購買歷史數據和查看商品記錄預測用戶感興趣的商品,業(yè)務目標是對用戶可能購買的商品進行自動推薦。但是,數據分析員可以基于這些數據對用戶的職業(yè)、興趣愛好等進行分析,導致用戶隱私泄漏。4)侵犯數據主體權益。按照《數據安全法(草案)》等要求,需要采取特定技術手段對數據主體提供訪問權、控制權、更正權等權益保護,使數據主體能夠及時了解、掌握自身數據參與數據分析挖掘的業(yè)務過程和參與程度。如數據在做某種用途的分析時,數據主體提出異議,需要能立即把相關數據從分析作業(yè)中刪除。但是,目前并沒有相應的生產流程和技術系統(tǒng)能夠滿足數據主體權益保護要求。5)產生不可預知的安全風險。大數據分析是一把雙刃劍,分析結果除了能夠實現正常的業(yè)務目標外,還可能產生其他難以預料的結果。如2016年劍橋分析事件,通過調查問卷收集美國選民所關注的問題,對這些數據進行分析后居然能夠得知每個選民的政治傾向,然后投放有針對性的廣告來引導他們的投票結果,最終達到干擾政治選舉的目的。

(3)開放共享過程安全風險

首先,由于海量數據治理困難,以及對分析過程中新產生的數據很難及時制定開放共享策略,使開放共享過程中存在不合規(guī)的開放和共享,導致數據泄漏。其次,在共享過程中,數據已經脫離所有者的控制,數據追蹤溯源技術并不成熟,無法跟蹤數據的最終去向和使用情況,使數據處于失控狀態(tài)。再次,由于數據脫敏技術不成熟,脫敏后的數據會改變數據間原有的關系,降低數據價值。部分組織為了實現數據價值最大化,在未脫敏或脫敏不夠的情況下共享數據,導致數據面臨泄露的安全風險。最后,由于數據融合技術的發(fā)展,不同來源、不同維度的數據經過匯聚融合后,很可能把脫敏前的原始數據還原出來。

(4)交易流通過程安全風險

交易流通是數據價值體現的基本途徑,更是盤活數據、用好數據的關鍵環(huán)節(jié)。目前,典型的數據交易模式是代理商模式,由數據提供者、數據代理商(中介)和數據消費者等三個角色組成。數據提供者擁有數據資源,把數據賣給數據代理商。數據代理商既可以把交易的原始數據賣給數據消費者,又可以把基于原始數據進行挖掘分析得到價值更高的分析結果數據賣給數據消費者。在數據交易流通過程中,一方面,數據提供者主要通過爬蟲等技術采集數據,可能侵犯用戶個人隱私。2019年9月,魔蝎科技和同盾科技等多家第三方大數據公司因非法采集和向金融機構提供用戶數據,侵犯用戶個人隱私而被公安機關調查。另一方面,數據已經脫離數據擁有者的掌控,數據代理商取代數據擁有者,成為數據的掌控者。因此,數據代理商等第三方的數據安全防護能力和安全管理力度決定數據的安全性。根據美國銀行信用卡發(fā)行商TCM Bank公開消息,由于第三方供應商管理的網站存在配置錯誤問題,導致信用卡申請人數據在2017年3月至2018年7月期間暴露在互聯網上長達16個月。

(5)數據產品使用過程安全風險

目前,隨著信息系統(tǒng)整合共享等一系列舉措的實施和推進,海量數據資源進一步共享和匯聚,為數據產品的開發(fā)打好了堅實的基礎,數據的下一站即是數據應用——數據產品。但是,數據產品可能給個人、組織和國家?guī)戆踩L險。一方面,由于數據產品是基于用戶個人信息或者其它社會數據等開發(fā)出來的,目前既缺乏相關法律法規(guī)和標準規(guī)范對數據產品的開發(fā)進行指導和約束,又缺乏數據產品相關的檢測評估機構和檢測技術手段,在數據產品上市交易前沒辦法對其可能帶來的安全風險進行評估。另一方面,由于數據產品作為商品在交易過程中存在再次轉手交易的情況,以及數據產品具有易復制、修改等特點,使數據產品在使用、流通過程中面臨被非法復制、非法傳播、非法篡改和知識產權竊取等安全風險。

三、建議

針對數據安全保護存在的問題,需要結合數據安全特點,提高對數據安全的理解認識,完善數據安全標準規(guī)范,建設以數據為中心的安全保障體系。

1.正確理解認識數據安全保護

一方面,需要把握數據的本質特征。數據不僅是資產,更是一種生產要素,通過對數據進行分析挖掘,能夠產生新的數據,得到新的數據產品。通過共享和交易,數據在碰撞、關聯和比對等過程中能夠最大化數據的價值。而數據在分析挖掘、共享交易等動態(tài)流轉過程中,更容易面臨隱私泄漏、數據竊取、數據誤用和濫用等安全風險。另一方面,需要轉變數據安全保護理念。數據使用場景多而復雜,應用環(huán)境開放,傳統(tǒng)的安全防護措施難以適應新的應用場景。需要結合數據安全具有的新特點,以數據為核心,以生產過程中用戶對數據的操作、訪問行為和被訪問的數據為分析對象,建立風險控制模型,對數據的流向、數據訪問頻次和數據體量等持續(xù)進行安全風險監(jiān)測,實現數據安全、自由流動。

2.加快完善數據安全標準規(guī)范

一方面,在全球層面需要統(tǒng)籌制定全球數據安全標準規(guī)范。依據《全球數據安全倡議》提出的原則和內容,聯合世界其他國家簽訂雙邊或多邊承諾協議,在普遍參與的基礎上達成國際共識,制定相關標準規(guī)范。另一方面,在國家層面需要制定與數據安全法等配套的標準規(guī)范與實施細則。需要以《數據安全法(草案)》為指導,統(tǒng)籌考慮現有數據安全標準,查漏補缺。組織數據提供者、數據代理商(中介)和數據消費者等數據參與單位,規(guī)劃涵蓋數據生產全生命周期的安全標準體系,加快研制數據安全風險評估、數據安全審計和數據安全應急響應等重點標準,支撐《數據安全法(草案)》的落地與實施。

3.建設以數據為中心的安全保障體系

針對數據安全面臨的問題,需要構建以數據為中心的動態(tài)安全防控體系,通過數據治理、安全防護措施、風險識別和審計溯源等手段重點識別和控制數據訪問、應用和流轉等動態(tài)過程中的安全風險。第一、數據治理。通過大數據治理實現數據分類分級、數據溯源,能夠從全域的角度“看得見、看得清”所有的數據,包括數據存儲、使用流轉情況和對應的數據安全策略。掌握數據流動情況,包括表與表之間的流動、系統(tǒng)之間的流動、部門之間的流動、單位之間的流動等等;第二、部署安全防護措施。在大數據基礎設施、數據挖掘分析和共享交易等方面采取安全防護措施,保障數據安全;第三、主動識別和控制風險。通過收集基礎設施、用戶操作、數據流轉等方面的日志數據,重點識別用戶對數據的異常操作風險和數據的異常流動風險;第四、安全審計與溯源分析。通過細粒度的數據行為審計與溯源能力建設,形成事后可審計、可溯源、可追責的威懾體系。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論