中國工程院院士鄔賀銓:大數(shù)據(jù)共享與開放及保護(hù)的挑戰(zhàn)

中國信通院
佚名
尊敬的陳部長最后,數(shù)據(jù)的價(jià)值在于融合與挖掘,政府?dāng)?shù)據(jù)對(duì)公眾的最大利益在于共享與開放。數(shù)據(jù)流通與交易有利于促進(jìn)數(shù)據(jù)的融合挖掘,數(shù)據(jù)的使用必須面對(duì)保護(hù)的責(zé)任與義務(wù),尤其是對(duì)個(gè)人隱私數(shù)據(jù)的保護(hù)。歐盟提出的GD...

中國工程院院士鄔賀銓:大數(shù)據(jù)共享與開放及保護(hù)的挑戰(zhàn)

尊敬的陳部長,各位領(lǐng)導(dǎo),各位專家,早上好,我的報(bào)告題目是大數(shù)據(jù)共享與開放保護(hù)的挑戰(zhàn),談三方面問題,大數(shù)據(jù)的共享與開放、大數(shù)據(jù)流通與交易、大數(shù)據(jù)的利用與保護(hù)。

先說說大數(shù)據(jù)的共享與開放。我們知道現(xiàn)在大數(shù)據(jù)本身有物理空間的數(shù)據(jù),有信息空間的書局,還有智慧空間的數(shù)據(jù),這是三元數(shù)據(jù)。作為網(wǎng)絡(luò)層面的數(shù)據(jù)有自媒體數(shù)據(jù)、富媒體數(shù)據(jù)、基層網(wǎng)絡(luò)數(shù)據(jù)、日志數(shù)據(jù),麥肯錫曾經(jīng)講過大數(shù)據(jù)的利用能給美國的保健、歐洲公共管理服務(wù)的提供者分別帶來3000美元、2500億歐元和6000億美元的年度價(jià)值,會(huì)給經(jīng)銷商帶來60%的利潤增加,會(huì)給制造業(yè)帶來50%的成本降低。麥肯錫曾經(jīng)統(tǒng)計(jì)過,受教育、運(yùn)輸、消費(fèi)產(chǎn)品、電力、游戲、保健,如果政府開創(chuàng)數(shù)據(jù),大約在保證國家安全和公民隱私的情況下開放數(shù)據(jù),可以帶來年度的全球經(jīng)濟(jì)價(jià)值32000億美元到54000億美元,所以大數(shù)據(jù)本身帶來的產(chǎn)業(yè)價(jià)值是很大的。

首先說共享,國務(wù)院關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要里提到推動(dòng)政府信息系統(tǒng)和公共數(shù)據(jù)的互聯(lián)共享,消費(fèi)信息孤島,避免重復(fù)建設(shè)和數(shù)據(jù)打架,增強(qiáng)政府的公信力,促進(jìn)社會(huì)信用體系建設(shè)。大數(shù)據(jù)共享是談什么共享呢?政府部門之間的數(shù)據(jù)共享、跨行政區(qū)域政府間的信息共享、政府與企業(yè)間的數(shù)據(jù)的合作和共享、企事業(yè)單位之間的數(shù)據(jù)共享,這是很多方面的,當(dāng)然我們可以先看政府層面的。需要設(shè)立大數(shù)據(jù)協(xié)同管理機(jī)構(gòu)促進(jìn)政府部門間的數(shù)據(jù)共享,必須有很多政府間合作才有很大得數(shù)據(jù)量,但是必須要健全地制造框架和制度體系,明確共享什么,明確參與共享的責(zé)任和義務(wù),要有互利,否則共享是很難持久的。現(xiàn)在一些城市設(shè)立大數(shù)據(jù)局來做這個(gè)工作,比如廣州大數(shù)據(jù)管理局,主要做協(xié)調(diào)政府內(nèi)部的信息平臺(tái)的共享,怎么打破部門之間的信息壁壘,共享各項(xiàng)民生數(shù)據(jù)。

另外需要建立進(jìn)一步的基礎(chǔ)數(shù)據(jù)庫,一方面是要集中存儲(chǔ)被共享的數(shù)據(jù),同時(shí)進(jìn)行清晰、校驗(yàn)和整合,提供可以共享的目錄,以便用戶可以接入和收取這些數(shù)據(jù)。當(dāng)然還要規(guī)定訪問的權(quán)限,跟你沒關(guān)的數(shù)據(jù)你不見得都需要去訪問。還要災(zāi)備等等。

這是政府基礎(chǔ)數(shù)據(jù)共享與交換平臺(tái),首先包括人口數(shù)據(jù)、空間地理數(shù)據(jù)、宏觀地理數(shù)據(jù)、醫(yī)療數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù),進(jìn)行融合、重組、轉(zhuǎn)換、關(guān)聯(lián)、安全。提供服務(wù)可以提供部門之間綜合的服務(wù),部門企業(yè)政府的數(shù)據(jù)共享。

按照行動(dòng)綱要的要求,明年中央就要構(gòu)建形成統(tǒng)一的互聯(lián)網(wǎng)數(shù)據(jù)平臺(tái),習(xí)總書記講要建立全國統(tǒng)一的數(shù)據(jù)集中的平臺(tái),當(dāng)然這是邏輯上的統(tǒng)一,是不是物理上都是統(tǒng)一,這可以研究。有一些跨神經(jīng)區(qū)域的大數(shù)據(jù)共享合作的例子,這里講的是連云港有個(gè)區(qū)是跨山東和江蘇的,跨兩個(gè)省,它徹底打破了行政區(qū)劃的限制,整合了山東和江蘇相鄰的幾個(gè)地方的監(jiān)控圖像數(shù)據(jù),要做統(tǒng)計(jì)分析、軌跡展示、布防布控,實(shí)現(xiàn)一鍵查詢、統(tǒng)一風(fēng)控報(bào)警、快速判定行竊軌跡等等,目前通過這個(gè)平臺(tái)抓獲了國內(nèi)違反犯罪人員500多名,破案400余起,這僅僅是這一個(gè)區(qū)和周邊五個(gè)縣就已經(jīng)取得這么好的成效。這是跨部門的大數(shù)據(jù)共享,發(fā)展行動(dòng)綱要提出要加快建立公民法人和其他組織的統(tǒng)一社會(huì)信用代碼制度,要有企業(yè)的信息公示系統(tǒng)。目前已經(jīng)建成了網(wǎng)絡(luò)執(zhí)行查獲系統(tǒng),現(xiàn)在已經(jīng)有13個(gè)國家部門、3000多家銀行能夠查詢11類14項(xiàng),使得全國法院可以了解所有被執(zhí)行人的情況,實(shí)現(xiàn)自動(dòng)化的精準(zhǔn)查詢。

中央政府之間的共享,監(jiān)察部對(duì)其他部門有監(jiān)督作用,他可以共享其他部門的數(shù)據(jù),不見得其他政府部門可以共享他的數(shù)據(jù),中紀(jì)委的數(shù)據(jù)不太可能跟其他部門全部共享,部分的數(shù)據(jù)共享可能是不對(duì)稱的。中央政府跟地方政府間的數(shù)據(jù)共享也是不對(duì)稱的,中央政府可以看到所有地方政府的數(shù)據(jù),但是不等于地方政府都能看到中央政府的數(shù)據(jù)。中央政府共享到什么層次,是省級(jí)、市級(jí)還有縣級(jí)現(xiàn)在沒有界定。政府?dāng)?shù)據(jù)共享到什么程度,是不是政府與政府部門之間所有工具都是透明的,至少公安部不會(huì)跟其他部門的數(shù)據(jù)透明。

政府跟企業(yè)間的數(shù)據(jù)共享是不對(duì)稱的,政府提供給企業(yè)的數(shù)據(jù)本身就是可以公開的數(shù)據(jù),除此之外政府也不能只給某個(gè)企業(yè)提供信息,而不給另一個(gè)企業(yè)提供信息。從國家安全出發(fā),政府是有權(quán)調(diào)用企業(yè)數(shù)據(jù),但除此之外企業(yè)是不是有義務(wù)一定要向政府提供數(shù)據(jù),這是有疑問的。在政府調(diào)用企業(yè)數(shù)據(jù)的情況下怎么保證企業(yè)的商業(yè)秘密不泄露,現(xiàn)在還沒有完成規(guī)范,企事業(yè)單位間的數(shù)據(jù)共享,這實(shí)際上是交易行為。在國家大數(shù)據(jù)行動(dòng)綱要提到,2018年要開展政府和社會(huì)合作開發(fā)大數(shù)據(jù)的試點(diǎn),不是簡單說政府調(diào)用企業(yè)的數(shù)據(jù),而是政府怎么跟企業(yè)合作開發(fā)。在關(guān)于積極推進(jìn)互聯(lián)網(wǎng)+行動(dòng)計(jì)劃綱要,開展一批社會(huì)治理互聯(lián)網(wǎng)的應(yīng)用試點(diǎn),打通政府部門、企事業(yè)單位之間的信息壁壘,利用大數(shù)據(jù)分析手段提升政府的數(shù)據(jù)治理能力。政府為了很多數(shù)據(jù),很多BAT數(shù)據(jù)政府是不擁有的,如果政府能把BAT數(shù)據(jù)融合在一起,對(duì)于政府能夠掌控社會(huì)智慧城市、中國的治理都會(huì)有很大的作用。

2013年在北愛爾蘭召開的會(huì)議提出了開放數(shù)據(jù),發(fā)布數(shù)據(jù)是為了激勵(lì)創(chuàng)新。開放14個(gè)重點(diǎn)領(lǐng)域,這里邊非常詳細(xì)。開放數(shù)據(jù)三項(xiàng)共同行動(dòng),激發(fā)國家的行動(dòng)計(jì)劃,每年都要評(píng)估政府開放數(shù)據(jù)的情況如何。要求發(fā)布的數(shù)據(jù)不是一般的數(shù)據(jù),而是高價(jià)值的數(shù)據(jù),包括預(yù)算、民主、環(huán)境,另外不僅僅是發(fā)布加工過的數(shù)據(jù),還要有源數(shù)據(jù),往往我們認(rèn)為政府發(fā)布的數(shù)據(jù)是加工過的,實(shí)際上只要不影響國家安全和公民隱私,很多原始數(shù)據(jù)政府應(yīng)該開放。開放的數(shù)據(jù)是要完整的、重要的、及時(shí)的,很重要讀,不要對(duì)某些公民開放,對(duì)某些公民不開放,不能說一定要有授權(quán)才能接入,不能開一陣就關(guān)掉了。共享是政府部門之間、政府和單位之間,開放是對(duì)社會(huì),所以在這點(diǎn)上對(duì)開放的要求是很嚴(yán)格的。

美國政府有個(gè)開放網(wǎng)站,有些沒有開放,公民提出來要求開放的時(shí)候要分析,有些就立即開放,有些經(jīng)過一段時(shí)間開放,因?yàn)榘踩[私原因沒法開放要向政府交代。而且開放數(shù)據(jù)要屏蔽掉隱私,比如他開放人口數(shù)據(jù),是安全編碼分區(qū)域的人口數(shù)據(jù),老齡化的有多少,上學(xué)兒童有多少,男的多少女的多少等等,可以看出這個(gè)地方的情況,還有用電量、犯罪記錄、中小學(xué)評(píng)估等等,可以判斷這個(gè)地方的學(xué)區(qū)房值不值得賣。還有小區(qū)的污染、噪聲等等。還要注意到美國政府的開放數(shù)據(jù)同時(shí)開放了數(shù)據(jù)挖掘的工具,幫助老百姓利用這些數(shù)據(jù),在政府開放數(shù)據(jù)的平臺(tái)收集了老百姓通過挖掘這些數(shù)據(jù)得出的可視化的結(jié)果,所以非常有利于公民對(duì)社會(huì)的了解。美國開放數(shù)據(jù)可以開放到很多方面,有交通、空氣污染、環(huán)境、支付各種。

這是英國的開放數(shù)據(jù),他在網(wǎng)上,比如你的收入是2萬英鎊,你就點(diǎn)網(wǎng)上,把鼠標(biāo)拉到2萬英鎊,得出你一年的稅收是8774英鎊,你的稅收用到哪里,用到政府運(yùn)行,每天的稅收,1.69用在國防,每個(gè)人都可以很清楚地看到你的納稅在政府里的應(yīng)用狀況,是陽光透明的。中間的大圖是英國總共收到的稅收,6948萬億英鎊,其中用在各個(gè)方面多少錢,就知道政府開支具體的狀況。中國政府開放得怎么樣?根據(jù)不完全統(tǒng)計(jì),中國政府?dāng)?shù)據(jù)開放平臺(tái)超過40多,其中沿海經(jīng)濟(jì)發(fā)達(dá)地區(qū)占總數(shù)的70%,西部中部還是比較少的,我們開放了教育、醫(yī)療、文體、環(huán)境,開放的數(shù)據(jù)存在什么問題?開放的總量偏低、結(jié)構(gòu)化程度低、數(shù)據(jù)質(zhì)量不高、民眾參與反饋不準(zhǔn)。我們還有很多方面做得不夠。

以北京的政府開放數(shù)據(jù)為例,去年北京政府主動(dòng)公開政府信息超過100萬條,跟2015年差不多,其中主動(dòng)公開的文件不到1萬件,主動(dòng)公開的重點(diǎn)政府領(lǐng)域信息73萬條,細(xì)看一下北京公開的政府信息里主要是關(guān)于食品安全標(biāo)準(zhǔn)和食品生產(chǎn)的占了一半,關(guān)于企業(yè)信用系統(tǒng)占40%,兩項(xiàng)加起來占了90%,剩下的只有10%,10%有政府的三公預(yù)算、農(nóng)民征地、政府定價(jià),實(shí)際上可以看到還是很不全面的,還有很多可以開放應(yīng)該開放的數(shù)據(jù)沒有開放。公民關(guān)心食品安全,所以這方面的數(shù)據(jù)比較多。

聯(lián)合國電子政務(wù)發(fā)展指數(shù),有三項(xiàng),信息基礎(chǔ)設(shè)施、人力資源、在線服務(wù)的情況,其中在線服務(wù)跟開放數(shù)據(jù)有關(guān)。我們看到兩年統(tǒng)計(jì)一次,2016年開放電子政務(wù)發(fā)展最好是英國,中國排第63位,還是比較靠后的。數(shù)據(jù)有個(gè)晴雨表,開放數(shù)據(jù)的準(zhǔn)備程度、開放數(shù)據(jù)的執(zhí)行力,開放了什么類型,質(zhì)量怎么樣,開放數(shù)據(jù)的影響力、效果、透明性、對(duì)環(huán)境的影響、對(duì)國家經(jīng)濟(jì)的影響。根據(jù)三方面來評(píng)價(jià),2014年中國排在46位,第一位是英國100分,中國只有28分。2015年中國退后了,排在第55位,不是說中國2015年跟2014年比沒有前進(jìn),而是別的國家前進(jìn)更多,相比之下中國得分排名反而下降。可以看到我們的影響力,特別是看到2015年的影響力只有8,我們也開放,但是我們開放的效果比較差,只有8,北京開放100萬條數(shù)據(jù),從應(yīng)用效果上來看反映還是不夠的。政府開放數(shù)據(jù)需要技術(shù)框架來支持,包括開放數(shù)據(jù)管理、開放數(shù)據(jù)技術(shù)、開放數(shù)據(jù)的門戶。今天我主要不是講技術(shù),所以不細(xì)致地解釋這部分了。

社會(huì)上有免費(fèi)開放數(shù)據(jù)的例子,有些公司現(xiàn)在在網(wǎng)上已經(jīng)公開地表示大家只要上網(wǎng)去點(diǎn),可以看到這些是免費(fèi)的,誰都可以用,有些比較簡單,有些是身份證查詢、手機(jī)查詢、IP地址查詢,還有股票、基金等等,當(dāng)然這些對(duì)老百姓可能有點(diǎn)用,但是基本上還是一種比較普通的開放數(shù)據(jù)。數(shù)據(jù)共享開放現(xiàn)在面臨三大挑戰(zhàn),不愿意共享開放,政府部門各自為政,把數(shù)據(jù)開成自己的權(quán)利,很多政府部門以信息不對(duì)稱作為手段,缺乏激勵(lì)機(jī)制,和技術(shù)部門共享數(shù)據(jù)還得向公眾開放數(shù)據(jù),得不到商業(yè)回報(bào),因此在多數(shù)情況下職能部門對(duì)于數(shù)據(jù)開放消極的被動(dòng)。現(xiàn)在很多法律法規(guī)制度不夠具體,不清楚哪些數(shù)據(jù)可以跨部門共享和向公眾開放,數(shù)據(jù)信息的共享開放有一定的風(fēng)險(xiǎn),搞不好把一些應(yīng)該保密的數(shù)據(jù)開放了,搞不好泄露了公民隱私,目前制度是不明確的,導(dǎo)致了我們政府開放存在風(fēng)險(xiǎn),責(zé)任很難界定。現(xiàn)在缺乏公共平臺(tái),共享渠道不暢,過去信息的傳遞多數(shù)是部門之間通過電子郵件進(jìn)行,安全性保密性可持續(xù)性很難保證,沒有統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,不同職能部門對(duì)數(shù)據(jù)的采集記錄標(biāo)準(zhǔn)千差萬別,統(tǒng)計(jì)口徑和時(shí)間不一致,沒法用。數(shù)據(jù)開放需要脫敏,缺乏必要的技術(shù)和人才支撐,很難按照技術(shù)標(biāo)準(zhǔn)來規(guī)范。所以實(shí)際上我們數(shù)據(jù)開放面臨三大挑戰(zhàn)。

第二,大數(shù)據(jù)的流通與交易。什么叫數(shù)據(jù)交易?數(shù)據(jù)有提供方有使用方,很多時(shí)候需要通過數(shù)據(jù)中介方,政府開放的數(shù)據(jù)在脫敏以后的原始數(shù)據(jù),我們有數(shù)據(jù)挖掘公司,開放了政府收集的數(shù)據(jù),在加工以后把它出售,給數(shù)據(jù)使用方、行業(yè)戶,數(shù)據(jù)生產(chǎn)者、原始的要脫敏的數(shù)據(jù)給數(shù)據(jù)挖掘的中介方清洗以后提供給行業(yè)用戶,通過中介方整合挖掘合并清洗以后,提供給行業(yè)用戶。數(shù)據(jù)生產(chǎn)加工者,清洗后的數(shù)據(jù)通過數(shù)據(jù)交易所、數(shù)據(jù)交易所就是倒手,把他清洗加工后的數(shù)據(jù)轉(zhuǎn)售給行業(yè)用戶,或者數(shù)據(jù)生產(chǎn)者直接把原始脫敏的數(shù)據(jù)交給行業(yè)用戶。

一般來講數(shù)據(jù)生產(chǎn)者是很少直接面向最終用戶的,大多通過中介渠道實(shí)現(xiàn)自身數(shù)據(jù)的變現(xiàn),像美國的推特本身不直接銷售他的數(shù)據(jù),把他的數(shù)據(jù)授權(quán)給好幾個(gè)公司,讓他們賣,目前美國的數(shù)據(jù)中介思想在2012年的最規(guī)模已經(jīng)達(dá)到1500億美元,數(shù)據(jù)中介本身也是一個(gè)很大的產(chǎn)業(yè)。美國有好多數(shù)據(jù)中介公司,這些中介公司通過各種渠道收集和買數(shù)據(jù),Clemic(音)從政府收購數(shù)據(jù),他自己也有傳感器,也收集了一些數(shù)據(jù)。

中國聯(lián)通有很多用戶數(shù)據(jù),包括OSS的上網(wǎng)流量、BSS的用戶的詳單等等,這些數(shù)據(jù)不是中國聯(lián)通的,都是用戶的,中國聯(lián)通可以進(jìn)行加工利用,通過脫敏,屏蔽掉個(gè)人隱私,當(dāng)然這里面要通過審核,他可以接受很多公司的委托,有審核他的需求,通過各種分析通過過濾最后可以提供服務(wù),聯(lián)通是以咨詢的方式對(duì)外部的公司提供服務(wù),他們已經(jīng)上線了身份核查、位置驗(yàn)證行為評(píng)估等等,已經(jīng)服務(wù)于招行、螞蟻金服、住建部、交通部等等,這是數(shù)據(jù)收集者直接數(shù)據(jù)挖掘然后提供服務(wù)。

目前在我們國家網(wǎng)上出售的數(shù)據(jù)有多少呢?有公司已經(jīng)出售了一些數(shù)據(jù)??偟膩碚f現(xiàn)在網(wǎng)上出售的所謂大數(shù)據(jù)都不夠大,不夠大也不能說一點(diǎn)沒有用,從大數(shù)據(jù)的角度還是有限的,這是公司本身的行為。

大數(shù)據(jù)交易關(guān)鍵對(duì)數(shù)據(jù)質(zhì)量的要求,準(zhǔn)確性,你一般會(huì)提供原始數(shù)據(jù),我怎么知道你的數(shù)據(jù)是真實(shí)的完整的,萬一你提供給我的是不全面的、不真實(shí)的假的,我買的數(shù)據(jù)挖掘結(jié)果你告訴我這是數(shù)據(jù)挖掘,誰知道你挖了多少數(shù)據(jù),最后怎么能判斷你是真假,這里沒有第三方,所以這是個(gè)大問題。還有完整性,數(shù)據(jù)是不是缺漏,很多時(shí)候是數(shù)據(jù)過濾和脫敏以后的,如果說簡單只是為了避免安全、隱私,但是最后你的數(shù)據(jù)還得有全面性,不能是片面的。還有一致性,同類數(shù)據(jù)的表述形式是否一致,出現(xiàn)多次的數(shù)據(jù)是不是差異,數(shù)據(jù)是不是符合標(biāo)準(zhǔn),是不是合規(guī),否則買來的數(shù)據(jù)也不好用。

合法性,你賣給我的數(shù)據(jù)所有權(quán)是不是你的,我現(xiàn)在問一些國內(nèi)的數(shù)據(jù)交易所數(shù)據(jù)是哪兒來的,他說政府的數(shù)據(jù),我說政府?dāng)?shù)據(jù)不能賣錢,政府?dāng)?shù)據(jù)能公開就是免費(fèi),他說有些企業(yè)給我的數(shù)據(jù),我說首先明確企業(yè)給你的數(shù)據(jù)是不是企業(yè)自身的,三大運(yùn)營商有數(shù)據(jù),但數(shù)據(jù)所有權(quán)不是三大運(yùn)營商的。數(shù)據(jù)及時(shí)性,你給我的數(shù)據(jù)是2017的數(shù)據(jù)還是2016的數(shù)據(jù),你是不是有實(shí)時(shí)性??捎眯?,你給我的數(shù)據(jù)我能不能容易理解,能不能用我的技術(shù)手段進(jìn)行分析挖掘。安全性,你給我的數(shù)據(jù)是不是真正把國家安全和個(gè)人隱私的都屏蔽掉了,不然我用了以后變成我侵犯別人的商業(yè)機(jī)密和個(gè)人隱私了。我把數(shù)據(jù)存在你的中介那里,你能不能保證這個(gè)存儲(chǔ)是安全的,不被污染的,數(shù)據(jù)不被竊取。

現(xiàn)在在我們國家做數(shù)據(jù)交易,我覺得有很多問題,現(xiàn)在沒有保證它的質(zhì)量。

大數(shù)據(jù)交易權(quán)限。政府的數(shù)據(jù)如果能夠開放那就是免費(fèi),不能開放的數(shù)據(jù)無論多少錢也不能賣,所以政府的數(shù)據(jù)不存在提供給中介方交易的問題,當(dāng)然中介方也許收集政府的數(shù)據(jù),通過加工可能他有他的勞動(dòng),運(yùn)營商收集的用戶數(shù)據(jù)原則上所有權(quán)是用戶,BAT收集的數(shù)據(jù)原則上所有權(quán)是用戶,但運(yùn)營商和BAT擁有對(duì)數(shù)據(jù)脫敏對(duì)挖掘分析后的加工結(jié)構(gòu)數(shù)據(jù)的所有權(quán)。沒有數(shù)據(jù)所有權(quán),有數(shù)據(jù)的公司通過挖掘向政府和企業(yè)提供咨詢報(bào)告,是不是允許在保護(hù)隱私和國家安全的情況下提供,他沒有數(shù)據(jù)所有權(quán),但是他有數(shù)據(jù)挖掘能力,他進(jìn)行挖掘加工了,這個(gè)時(shí)候他是不是可以提供,沒有數(shù)據(jù)但是有數(shù)據(jù)挖掘能力的公司可以受委托完成數(shù)據(jù)挖掘。受委托挖掘以后,他能不能利用數(shù)據(jù)為非委托方服務(wù)呢,應(yīng)該是不允許,但是現(xiàn)在沒有明確規(guī)定。

沒有數(shù)據(jù)也沒有挖掘能力的公司,可以作為中介平臺(tái),但是是不是可以允許他截留數(shù)據(jù)呢?中介方收集了政府開放的數(shù)據(jù)據(jù)為己有并且出售是不是合法?很多政府公開的數(shù)據(jù),有些網(wǎng)站標(biāo)明價(jià)格出售,按道理這是政府的數(shù)據(jù),盡管你去收集花點(diǎn)時(shí)間,但是畢竟還是公開的東西,你是不是能出售?在數(shù)據(jù)源的穩(wěn)定性、更新頻率和數(shù)據(jù)擴(kuò)散方面也要商量明確的界限。

怎么衡量數(shù)據(jù)的價(jià)值?精加工的數(shù)據(jù)可視化的數(shù)據(jù)怎么定價(jià),怎么衡量數(shù)據(jù)挖掘的工作量,你做了多少工作,一次性買斷的數(shù)據(jù)和可以重復(fù)多次出售的數(shù)據(jù)怎么定價(jià),數(shù)據(jù)的價(jià)值跟時(shí)效性什么關(guān)系,應(yīng)該隨著時(shí)間掉價(jià),是不是需要有對(duì)數(shù)據(jù)評(píng)估的第三方機(jī)構(gòu),現(xiàn)在都是兩者來談。國內(nèi)的數(shù)據(jù)流通和交易存在什么問題?我國數(shù)據(jù)源的活行不夠,數(shù)據(jù)中介機(jī)構(gòu)處于起步階段。政府企業(yè)組織沒有充分認(rèn)識(shí)到用外部數(shù)據(jù)可以對(duì)自身工作和業(yè)務(wù)起到巨大的提升作用,所以一般來講都很少利用外部數(shù)據(jù)。很多數(shù)據(jù)擁有者對(duì)數(shù)據(jù)里蘊(yùn)含的東西缺乏足夠的洞察,不放心讓自己的數(shù)據(jù)進(jìn)入流通環(huán)節(jié),擔(dān)心企業(yè)隱私機(jī)密泄露。剛才是不愿意吸收外部數(shù)據(jù),這是不愿意把自己數(shù)據(jù)拿出去流通,大部分?jǐn)?shù)據(jù)資源的壟斷,關(guān)注自己的小生態(tài)圈,不愿意把自己的數(shù)據(jù)資源向生態(tài)圈之外的市場提供,所以流通也不夠,交易也不夠,利用更不夠。

這個(gè)月剛剛掛牌的大數(shù)據(jù)流通與交易技術(shù)的國家工程實(shí)驗(yàn)室,是發(fā)改委批的,有上海數(shù)據(jù)交易所牽頭,聯(lián)合了浪潮、聯(lián)通、互聯(lián)網(wǎng)信息中心。

大數(shù)據(jù)利用和保護(hù)。什么數(shù)據(jù)要保護(hù)?和國家安全有關(guān)的數(shù)據(jù)要保護(hù),和企業(yè)商業(yè)秘密有關(guān)的數(shù)據(jù)要保護(hù),公民隱私的數(shù)據(jù)要保護(hù)。目前歐盟制定了嚴(yán)格的數(shù)據(jù)保護(hù)法案,中國雖然有宏觀上的數(shù)據(jù)保護(hù)的要求,但是沒有全面的數(shù)據(jù)保護(hù)法規(guī)。關(guān)于歐盟的數(shù)據(jù)保護(hù),去年4月份歐洲議會(huì)通過了通用數(shù)據(jù)保護(hù)法案,也叫一般數(shù)據(jù)保護(hù)要求。這個(gè)法案要在明年5月25日生效,還有一年左右,這個(gè)數(shù)據(jù)保護(hù)法案里沒有國家安全、企業(yè)秘密。涉及歐盟里面的單位對(duì)多元數(shù)據(jù)的處理,這個(gè)處理不管在歐盟內(nèi)部處理還是在歐盟外部處理都要受這個(gè)法規(guī)管。沒有在歐盟里有分支機(jī)構(gòu),但是你向歐盟的消費(fèi)者提供服務(wù),不管你的服務(wù)是不是收錢也都受這個(gè)法規(guī)的約束,你對(duì)歐盟里頭的消費(fèi)者進(jìn)行行為監(jiān)控,歐盟之外如果已經(jīng)有的法律受歐盟成員國控制的也在這里。所以要注意的是處理者不在歐盟里邊不重要,但是歐盟里頭的消費(fèi)者都要受這個(gè)管理,中國的企業(yè)如果把微信支付寶用到了歐洲,那么一樣你也要受這個(gè)管理。什么叫多元數(shù)據(jù)?多元數(shù)據(jù)是跟個(gè)人隱私、專業(yè)、公共生活有關(guān)的任何信息,包括姓名、照片、電子郵件地址、IP地址等。

針對(duì)個(gè)人的信息的收集、記錄、組織、建構(gòu)、存儲(chǔ)、修改、咨詢、使用、傳播和其他的應(yīng)用,包括排列組合,無論是人工處理還是自動(dòng)化處理,你可以通過這些處理能夠針對(duì)自然然的工作表現(xiàn)、經(jīng)濟(jì)狀況、健康狀況、個(gè)人偏好、興趣、這里個(gè)人隱私的范圍是很寬的,包括個(gè)人的IP地址都是隱私。個(gè)人對(duì)自己數(shù)據(jù)有什么權(quán)益?個(gè)人具有管理自己個(gè)人數(shù)據(jù)的權(quán)益,具有自己的數(shù)據(jù)被泄露能夠獲得及時(shí)通知的權(quán)利以及被遺忘權(quán)。對(duì)個(gè)人數(shù)據(jù)處理有什么要求?合法公正透明,必須有規(guī)有法。目的是有限的,你可能為某一個(gè)目的來收集處理,只要是為公共利益或者歷史研究的目的、統(tǒng)計(jì)的目的,目標(biāo)是有限的。數(shù)據(jù)是最小性,你獲得我的數(shù)據(jù)不能把我所有的數(shù)據(jù)都要,可能跟某個(gè)目的有關(guān)的數(shù)據(jù)被使用,但是不能把所有數(shù)據(jù)都拿走。及時(shí)性,你用完以后要毫不延遲的刪掉處理掉。存儲(chǔ)的有限性。只有為了公共利益或歷史研究,個(gè)人數(shù)據(jù)才能長時(shí)間存儲(chǔ),其他目的個(gè)人數(shù)據(jù)不能長時(shí)間存儲(chǔ)。完整性,要保證你收集的數(shù)據(jù)要有技術(shù)措施保證它不能受非法授權(quán)、非法處理、遺失丟失損毀。

關(guān)于數(shù)據(jù)處理什么算合法?并不是說個(gè)人數(shù)據(jù)不能處理,以下的規(guī)定可以處理。本人同意可以作為一個(gè)或多個(gè)特定目的,我特意查了一下所謂本人同意是要書面同意,要寫下來同意。我有一個(gè)合同,要有個(gè)人數(shù)據(jù),處理的數(shù)據(jù)主體在簽合同前的請(qǐng)求。處理是為了執(zhí)行法律,當(dāng)然要征求。處理是為了保護(hù)我自己,為了保護(hù)另一個(gè)自然人的切身利益,為了保護(hù)利益。處理是為了公共利益,處理是為了追求合法的利益的必要,這是允許商業(yè)利用,利益的商業(yè)部門企業(yè)來處理個(gè)人數(shù)據(jù),首先是為了合法利益,當(dāng)然不能侵犯提供個(gè)人信息的數(shù)據(jù)的消費(fèi)者的利益,尤其是兒童。我們現(xiàn)在手機(jī)上的APP幾乎所有APP都收集個(gè)人信息,收集完了如果有合法利益的那是允許的,什么界定你的合法利益,很多時(shí)候不見得是合法利益。有個(gè)社會(huì)調(diào)研,有人提出來你是否愿意為了你將來的應(yīng)用資費(fèi)上的優(yōu)惠犧牲你的隱私,全國有27%的人表示可以犧牲隱私,中國有38%的人表示可以犧牲隱私,中國更多人認(rèn)為隱私不重要,反而優(yōu)惠更重要。

傳輸存儲(chǔ)和開發(fā)要有要求,所有的軟件包括移動(dòng)應(yīng)用的APP在開發(fā)階段和運(yùn)行數(shù)據(jù)處理階段要保護(hù)個(gè)人數(shù)據(jù)的隱私,數(shù)據(jù)控制也含APP,要有充分的技術(shù)和措施確保數(shù)據(jù)和移動(dòng)應(yīng)用的完整性,必須應(yīng)對(duì)數(shù)據(jù)處理面臨的風(fēng)險(xiǎn),處理的時(shí)候是不是數(shù)據(jù)被丟失了,有很多要求。違規(guī)怎么辦?一般性的違規(guī),處理上限是罰款1千萬歐元。如果嚴(yán)重違規(guī)的罰款上限是2千萬歐元,上一年度的營業(yè)額的4%,BAT營業(yè)額都到幾百億的話,要罰起來不得了。云計(jì)算跟這個(gè)法規(guī)什么關(guān)系?管理者負(fù)主流責(zé)任,如果一個(gè)政府在云里存儲(chǔ)了數(shù)據(jù),你就是管理者,很多人認(rèn)為我把數(shù)據(jù)存在云平臺(tái),管理者是云平臺(tái),歐盟提出來你存進(jìn)去你應(yīng)該對(duì)數(shù)據(jù)所有的保密、安全負(fù)責(zé),所以云平臺(tái)有云平臺(tái)的責(zé)任,你存數(shù)據(jù)也有你的責(zé)任。法規(guī)不受限于公司國籍,不受限于云服務(wù)的地理位置,如果在中國存了關(guān)于歐洲公民的個(gè)人數(shù)據(jù),這個(gè)法規(guī)也適用,所以在中國的云平臺(tái)里不是說什么數(shù)據(jù)都存進(jìn)去有用。目前80%的云服務(wù)不會(huì)在合同終止的時(shí)候立即刪除客戶的數(shù)據(jù),58%的云服務(wù)不能提供IT所有權(quán)的保證。對(duì)2萬多個(gè)云服務(wù)的調(diào)查,只有6%的云服務(wù)符合這個(gè),如果現(xiàn)在云服務(wù)涉及到歐盟的消費(fèi)者,這里面就危險(xiǎn)了。

對(duì)中國有什么影響?法規(guī)提出非歐盟成員國公司只要滿足下邊兩個(gè)條件就受這個(gè)法規(guī)的影響。你向歐盟境內(nèi)可識(shí)別的自然人提供商品和服務(wù),收集和處理他們的信息,你做支付寶肯定收集了他的信息,你做微信肯定收集了他的信息。監(jiān)控歐盟境內(nèi)可識(shí)別自然人的行動(dòng)收集他們的信息,你做地圖服務(wù)也收集了信息。在歐盟境內(nèi)有分析機(jī)構(gòu)的外國公司,分析機(jī)構(gòu)被作為責(zé)任主體強(qiáng)制執(zhí)行法律要求。如果在歐盟境內(nèi)沒有分支機(jī)構(gòu),一旦境外公司高管進(jìn)入歐盟境內(nèi)將直接執(zhí)行,你小心,如果你犯規(guī)的話,你的高管進(jìn)去他就罰你,把你抓起來。所以對(duì)中國企業(yè)的移動(dòng)應(yīng)用安全數(shù)據(jù)收集處理交易產(chǎn)生重大的影響。首當(dāng)其沖的是銀行、電子商務(wù)、互聯(lián)網(wǎng)、IT企業(yè)、軟硬件生產(chǎn)商。歐盟這個(gè)法規(guī)既有保護(hù)他的意義,也有很多是限制。

我們國家當(dāng)然也有一些數(shù)據(jù)開發(fā)應(yīng)用的文件,工信部出臺(tái)的大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃,去年出臺(tái)的網(wǎng)絡(luò)安全法都提到對(duì)個(gè)人信息和重要數(shù)據(jù)在境內(nèi)存儲(chǔ),保護(hù)信息安全和個(gè)人隱私,我們的規(guī)范都很宏觀,不具體,真正違反了怎么樣并沒有沒有。跟歐盟的比,我們準(zhǔn)備得還是比較粗的。

最后,數(shù)據(jù)的價(jià)值在于融合與挖掘,政府?dāng)?shù)據(jù)對(duì)公眾的最大利益在于共享與開放。數(shù)據(jù)流通與交易有利于促進(jìn)數(shù)據(jù)的融合挖掘,數(shù)據(jù)的使用必須面對(duì)保護(hù)的責(zé)任與義務(wù),尤其是對(duì)個(gè)人隱私數(shù)據(jù)的保護(hù)。歐盟提出的GDPR將數(shù)據(jù)保護(hù)的嚴(yán)重性提高到前所未有的程度,需要引起我們的高度重視。數(shù)據(jù)的共享開放、流通交易和數(shù)據(jù)保護(hù)以及數(shù)據(jù)安全,對(duì)數(shù)據(jù)技術(shù)提出的研究挑戰(zhàn),區(qū)塊鏈技術(shù)在數(shù)據(jù)流通交易的保護(hù)方面能夠起到一定的作用,數(shù)據(jù)的共享開放流通交流使用保護(hù)對(duì)法律的制定與執(zhí)行提出了很高要求,同時(shí)需要平衡數(shù)據(jù)的保護(hù)與數(shù)據(jù)的開發(fā)利用

THEEND