充分發(fā)揮數(shù)據(jù)價(jià)值 ——為數(shù)據(jù)打造安全可靠、簡(jiǎn)單高效的存儲(chǔ)基礎(chǔ)設(shè)施

信息化觀察網(wǎng)
觀觀
生產(chǎn)要素貫穿人類社會(huì)經(jīng)濟(jì)和物質(zhì)文明發(fā)展的整個(gè)過(guò)程。在不同時(shí)期,因?yàn)樯a(chǎn)力水平的差異,不同生產(chǎn)要素對(duì)社會(huì)生產(chǎn)經(jīng)營(yíng)的影響權(quán)重不同。總體來(lái)說(shuō),人類社會(huì)生產(chǎn)力水平是在持續(xù)進(jìn)步的,在這個(gè)進(jìn)步的過(guò)程中,新的生產(chǎn)要素產(chǎn)生,并逐步發(fā)揮出重大作用,與既有生產(chǎn)要素一起幫助生產(chǎn)力進(jìn)一步提升。

數(shù)據(jù)成為生產(chǎn)要素

人類在社會(huì)生產(chǎn)經(jīng)營(yíng)活動(dòng)中,離不開(kāi)所需要的多種社會(huì)資源,這些社會(huì)資源是維系國(guó)民經(jīng)濟(jì)運(yùn)行及生產(chǎn)經(jīng)營(yíng)過(guò)程所必須具備的基本因素,被稱為“生產(chǎn)要素”。

生產(chǎn)要素貫穿人類社會(huì)經(jīng)濟(jì)和物質(zhì)文明發(fā)展的整個(gè)過(guò)程。在不同時(shí)期,因?yàn)樯a(chǎn)力水平的差異,不同生產(chǎn)要素對(duì)社會(huì)生產(chǎn)經(jīng)營(yíng)的影響權(quán)重不同??傮w來(lái)說(shuō),人類社會(huì)生產(chǎn)力水平是在持續(xù)進(jìn)步的,在這個(gè)進(jìn)步的過(guò)程中,新的生產(chǎn)要素產(chǎn)生,并逐步發(fā)揮出重大作用,與既有生產(chǎn)要素一起幫助生產(chǎn)力進(jìn)一步提升。

農(nóng)業(yè)時(shí)代,土地和勞動(dòng)力是生產(chǎn)要素,承載了人類文明的延續(xù);進(jìn)入工業(yè)時(shí)代,技術(shù)飛躍發(fā)展,成為新的生產(chǎn)要素,極大程度解放了生產(chǎn)力并將人們從繁重體力勞動(dòng)中釋放出來(lái);在工業(yè)革命的加持下,人們有了更多時(shí)間來(lái)進(jìn)行腦力勞動(dòng),逐步發(fā)現(xiàn)資本在人類經(jīng)濟(jì)活動(dòng)中的作用猶如血液,如果對(duì)資本進(jìn)行合理配置,可以大幅提升人們的生產(chǎn)積極性以促進(jìn)生產(chǎn)力進(jìn)一步解放。

隨著科學(xué)技術(shù)不斷發(fā)展,人們發(fā)明了以數(shù)字化格式保存“信息”的方式,可以實(shí)現(xiàn)計(jì)算機(jī)對(duì)數(shù)字化格式的信息進(jìn)行高速處理(保存、傳輸、加工、分析……),這種方式極大地促進(jìn)了信息的留存、共享和價(jià)值創(chuàng)造,人們步入了信息時(shí)代。這種數(shù)字化格式的信息,就是我們常說(shuō)的“數(shù)據(jù)”。

信息,伴隨著人類社會(huì)發(fā)展的整個(gè)歷程:原始社會(huì),人們通過(guò)在繩子上打結(jié)、在巖壁上作畫(huà)、在動(dòng)物骨頭上刻字的方式,來(lái)記錄信息;后來(lái),人們使用竹簡(jiǎn)、羊皮卷、紙張等來(lái)記錄信息。越來(lái)越多的信息被記錄下來(lái),人們從這些信息中總結(jié)出知識(shí),并提升為智慧,不斷推動(dòng)社會(huì)生產(chǎn)力和人類文明向前發(fā)展??梢哉f(shuō),信息的留存與分享,是社會(huì)生產(chǎn)力和人類文明得以發(fā)展的最底層邏輯。通過(guò)“數(shù)據(jù)”這種方式對(duì)信息的留存與分享進(jìn)行躍遷式效率提升,則是信息時(shí)代的最底層邏輯,這必將帶來(lái)社會(huì)生產(chǎn)力和人類文明的躍遷式發(fā)展。我們身處其中,何其有幸。

2020年,我國(guó)在《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》中,首次把數(shù)據(jù)與土地、勞動(dòng)力、技術(shù)、資本并列為生產(chǎn)要素,凸顯出數(shù)據(jù)這一新型生產(chǎn)要素在國(guó)民經(jīng)濟(jì)運(yùn)行及生產(chǎn)經(jīng)營(yíng)過(guò)程發(fā)展的新階段會(huì)發(fā)揮出不可替代的重大作用,作為一種基礎(chǔ)資源和創(chuàng)新引擎,促進(jìn)社會(huì)生產(chǎn)力的跨越式增長(zhǎng)。

640 (1).png

圖示1:數(shù)據(jù)要素兩大屬性和五大特征

數(shù)據(jù)——安全可靠的基礎(chǔ)資源,簡(jiǎn)單高效的創(chuàng)新引擎

作為基礎(chǔ)資源,數(shù)據(jù)類似于土地(耕地、礦藏、油氣等)、勞動(dòng)力,需要被充分保護(hù)起來(lái),做到安全可靠,才能發(fā)揮出其基礎(chǔ)資源的作用。例如,人們會(huì)根據(jù)土地資源類型的不同,對(duì)其做到防旱防澇防污染等保護(hù)。又如,對(duì)于勞動(dòng)者,不同國(guó)家均有完善的法律法規(guī)保護(hù)勞動(dòng)者的合法權(quán)益、人身安全。相較于土地、勞動(dòng)力這樣的基礎(chǔ)資源,數(shù)據(jù)具有依附性和易復(fù)制兩大特征,因而在安全可靠層面需要有不同的考量:

一、依附性。這個(gè)特征與技術(shù)要素類似,大多需要依附于特定研發(fā)組織或科技人才而存在,而數(shù)據(jù)具有不可見(jiàn)、沒(méi)有具體實(shí)物形態(tài)的特點(diǎn),需要依賴于機(jī)械硬盤(pán)、固態(tài)硬盤(pán)進(jìn)行儲(chǔ)存。當(dāng)數(shù)據(jù)量較大,則需要存儲(chǔ)、磁帶庫(kù)等專業(yè)存儲(chǔ)系統(tǒng)來(lái)進(jìn)行保存。依附性要求我們?cè)谑褂脭?shù)據(jù)時(shí),必須考慮數(shù)據(jù)的來(lái)源、質(zhì)量和適用范圍,以采用相匹配的存儲(chǔ)介質(zhì)和方式進(jìn)行數(shù)據(jù)存放。

二、易復(fù)制。數(shù)據(jù)可以被快速、方便地復(fù)制,進(jìn)而在條件允許的前提下重復(fù)使用、循環(huán)使用乃至無(wú)窮盡開(kāi)發(fā)。這與其他一些生產(chǎn)要素相比(如土地),是完全不同的,例如,兩個(gè)數(shù)據(jù)擁有者相互交換數(shù)據(jù)后,本質(zhì)就是一個(gè)數(shù)據(jù)再?gòu)?fù)制的過(guò)程,每個(gè)擁有者可訪問(wèn)數(shù)據(jù)量均翻番,更有利于價(jià)值創(chuàng)造。同時(shí),易復(fù)制性也引發(fā)了版權(quán)保護(hù)和數(shù)據(jù)安全的問(wèn)題。數(shù)據(jù)的復(fù)制和傳播需要遵循法律法規(guī),尊重?cái)?shù)據(jù)所有權(quán),保護(hù)個(gè)人隱私。同時(shí),數(shù)據(jù)的安全存儲(chǔ)和傳輸也至關(guān)重要,以防止數(shù)據(jù)泄露和濫用。

依附性和易復(fù)制作為數(shù)據(jù)要素不同于其他基礎(chǔ)資源類生產(chǎn)要素的特征,決定了需要從自主創(chuàng)新、介質(zhì)安全、內(nèi)生安全維度來(lái)保障數(shù)據(jù)要素的安全可靠:

640 (1).png

圖示2:安全可靠數(shù)據(jù)基礎(chǔ)設(shè)施,發(fā)揮數(shù)據(jù)基礎(chǔ)資源作用

1、自主創(chuàng)新。如果承載數(shù)據(jù)的基礎(chǔ)設(shè)施受制于人,那么所有的安全都無(wú)從談起。目前國(guó)內(nèi)數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)布局完整,從存儲(chǔ)芯片到保存數(shù)據(jù)的顆粒,再到操作系統(tǒng)、軟件、硬件,完全具備自主創(chuàng)新的能力。當(dāng)然,自主創(chuàng)新不代表全部國(guó)產(chǎn)化,而是要確保在最關(guān)鍵的環(huán)節(jié)上,將主動(dòng)權(quán)掌握在自己手里,確保任何時(shí)候都不會(huì)因?yàn)楣?yīng)或者技術(shù)而受制于人。

2、介質(zhì)安全。無(wú)論是PC還是服務(wù)器還是存儲(chǔ)系統(tǒng),有超過(guò)80%數(shù)據(jù)還存在與由馬達(dá)驅(qū)動(dòng)的機(jī)械硬盤(pán)中,但是硬盤(pán)的技術(shù)、材料、專利實(shí)際是被國(guó)外公司控制著;閃存是先進(jìn)的存儲(chǔ)技術(shù),國(guó)產(chǎn)閃存介質(zhì)也在全面走向成熟。與此同時(shí),在存儲(chǔ)系統(tǒng)層面,我國(guó)也掌握了世界領(lǐng)先的技術(shù),部分廠商也已經(jīng)進(jìn)入了該領(lǐng)域的全球領(lǐng)導(dǎo)者行列。充分關(guān)注存儲(chǔ)介質(zhì)(硬盤(pán)和存儲(chǔ)系統(tǒng))安全,這對(duì)數(shù)據(jù)最底層的安全可靠提供了堅(jiān)實(shí)保障。

3、內(nèi)生安全。構(gòu)建數(shù)據(jù)基礎(chǔ)設(shè)施內(nèi)生安全能力,建立數(shù)據(jù)基礎(chǔ)設(shè)施中的防勒索體系,健全數(shù)據(jù)存儲(chǔ)的容災(zāi)、備份體系,通過(guò)先進(jìn)存儲(chǔ)技術(shù)建立數(shù)據(jù)流通基礎(chǔ)設(shè)施的安全屏障。

作為創(chuàng)新引擎,數(shù)據(jù)類似于技術(shù)、資本,必須要被充分使用起來(lái),才能夠產(chǎn)生價(jià)值,為人類社會(huì)創(chuàng)造新的財(cái)富,否則就是茶壺里煮餃子,倒不出來(lái)什么都不是。為了充分發(fā)揮數(shù)據(jù)的創(chuàng)新引擎作用,必須要關(guān)注其規(guī)模性、多樣性、流動(dòng)性特征,有針對(duì)性地為其營(yíng)造簡(jiǎn)單高效地使用環(huán)境:

一、規(guī)模性。隨著數(shù)據(jù)量的增加,人們從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律、挖掘知識(shí)的效率和準(zhǔn)確度會(huì)加速提升。例如,在醫(yī)療健康領(lǐng)域,人們可能很難從單個(gè)醫(yī)院的病理數(shù)據(jù)集中找出有效的信息,但是如果將某個(gè)區(qū)域所有醫(yī)院病理數(shù)據(jù)集匯聚起來(lái),可能就比較容易發(fā)現(xiàn)該區(qū)域的健康狀況、疾病特征等關(guān)鍵信息;如果再疊加該區(qū)域歷史飲食習(xí)慣、氣候、人口流入流出等數(shù)據(jù),可能可以很快發(fā)現(xiàn)某種疾病的根源所在。簡(jiǎn)言之,數(shù)據(jù)只有形成規(guī)模,才能發(fā)揮其作用,且數(shù)據(jù)價(jià)值隨數(shù)據(jù)規(guī)模的增長(zhǎng)而加速提升。

二、多樣性。數(shù)據(jù)的多樣性則意味著數(shù)據(jù)可以來(lái)自各種不同的來(lái)源,每一種數(shù)據(jù)都可以提供獨(dú)特的視角和洞見(jiàn),這就需要多協(xié)議存儲(chǔ)來(lái)保存多樣化的數(shù)據(jù)。舉個(gè)例子,一雙手的作用是搬運(yùn)物體,當(dāng)與嘴巴結(jié)合,根據(jù)語(yǔ)境的不同,手和嘴共同表達(dá)意思比只用嘴要準(zhǔn)確,因此大規(guī)模的數(shù)據(jù)可以揭示出我們無(wú)法從單個(gè)數(shù)據(jù)點(diǎn)中看到的模式和趨勢(shì)。

三、流動(dòng)性。這是生產(chǎn)要素產(chǎn)生價(jià)值的基本前提,不同生產(chǎn)要素的流動(dòng)性程度存在天壤之別。土地流動(dòng)性最弱,勞動(dòng)力流動(dòng)性次之,技術(shù)流動(dòng)性適度,資本流動(dòng)性較強(qiáng),而數(shù)據(jù)流動(dòng)性最強(qiáng)勁。需要指出的是,不同生產(chǎn)要素在流動(dòng)過(guò)程中會(huì)呈現(xiàn)出形態(tài)迥異的特征。具體而言,勞動(dòng)力流動(dòng)和土地流轉(zhuǎn)既是市場(chǎng)經(jīng)濟(jì)“看不見(jiàn)的手”作用的必然結(jié)果,也是人們?cè)谙薅l件下追求收益最大化的結(jié)果。技術(shù)能夠作為商品流通的前提是它具有先進(jìn)性,如此方能在不同國(guó)家、地域、行業(yè)內(nèi)部(或之間)輸出與輸入。投機(jī)性和逐利性是資本流動(dòng)的基本特征,而資本在流動(dòng)的同時(shí)常常會(huì)和其他要素裹挾在一起發(fā)生裂變,因此它對(duì)經(jīng)濟(jì)社會(huì)推動(dòng)作用更加顯著。作為21世紀(jì)的國(guó)家戰(zhàn)略資源,數(shù)據(jù)要素的流動(dòng)呈現(xiàn)出速度更快、程度更深、領(lǐng)域更廣的特點(diǎn),這也讓它成了生產(chǎn)要素大家庭中最富有增長(zhǎng)價(jià)值的“潛力股”。

多樣性、規(guī)模性和流動(dòng)性做為數(shù)據(jù)要素在創(chuàng)新引擎方面的主要特征,決定了需要從數(shù)據(jù)管理、安全流動(dòng)、訪問(wèn)效率幾個(gè)維度來(lái)實(shí)現(xiàn)數(shù)據(jù)要素的簡(jiǎn)單高效:

640 (1).png

圖示3:簡(jiǎn)單高效數(shù)據(jù)基礎(chǔ)設(shè)施,發(fā)揮數(shù)據(jù)創(chuàng)新引擎作用

1、數(shù)據(jù)管理。以某跨國(guó)公司為例,每月初、每季度初、每年初都需要對(duì)前一個(gè)業(yè)務(wù)周期經(jīng)營(yíng)報(bào)表進(jìn)行整合,而財(cái)務(wù)數(shù)據(jù)則來(lái)自全球多個(gè)當(dāng)?shù)刈庸?,因此?jīng)營(yíng)報(bào)告往往是一項(xiàng)巨大而復(fù)雜的工程。IT部門(mén)通過(guò)構(gòu)建數(shù)據(jù)編織能力,打造出一張全局?jǐn)?shù)據(jù)地圖,進(jìn)而使公司的月度經(jīng)營(yíng)報(bào)告生成時(shí)間從18天縮短到3天,年度報(bào)告生成時(shí)間從3周縮短至1周,為集團(tuán)總公司根據(jù)業(yè)務(wù)經(jīng)營(yíng)進(jìn)行實(shí)時(shí)調(diào)整提供了數(shù)據(jù)基礎(chǔ),大幅提升經(jīng)營(yíng)決策效率。

2、安全流動(dòng)。各種不同類型的數(shù)據(jù)只有流動(dòng)起來(lái),才有可能兌現(xiàn)其數(shù)據(jù)資產(chǎn)的價(jià)值并促進(jìn)交易。例如氣象數(shù)據(jù)作為公共數(shù)據(jù),向農(nóng)業(yè)安全流動(dòng),指導(dǎo)全年農(nóng)作物種植結(jié)構(gòu)調(diào)整;向交通業(yè)安全流動(dòng),機(jī)場(chǎng)歷史天氣特征,可以預(yù)測(cè)航班延誤,甚至還包括旅游、零售、建筑等行業(yè)。可信數(shù)據(jù)空間保障數(shù)據(jù)在流動(dòng)過(guò)程中的安全可靠,避免關(guān)鍵信息遺失或被篡改,成為數(shù)據(jù)安全流動(dòng)、價(jià)值提升的關(guān)鍵因素。

3、訪問(wèn)效率。提升存儲(chǔ)訪問(wèn)效率,減少算力對(duì)數(shù)據(jù)的等待,提升算力可用度,是數(shù)據(jù)價(jià)值得以體現(xiàn)的關(guān)鍵環(huán)節(jié)。以某智算中心AI大模型訓(xùn)練為例,早期其數(shù)據(jù)中心采用“開(kāi)源分布式存儲(chǔ)軟件+服務(wù)器硬件”搭建,這種非專業(yè)的存儲(chǔ)系統(tǒng)存在讀寫(xiě)性能不佳、可靠性不足等天生缺陷,使其需要將數(shù)十PB數(shù)據(jù)量拆分成多個(gè)小存儲(chǔ)集群,AI大模型訓(xùn)練時(shí)頻繁地將數(shù)據(jù)在存儲(chǔ)集群間進(jìn)行搬遷,極大降低了算力可用度,造成嚴(yán)重浪費(fèi)。在該智算中心將數(shù)據(jù)遷移到專業(yè)數(shù)據(jù)存儲(chǔ)解決方案后,消除了無(wú)效數(shù)據(jù)搬移,并大幅提升了數(shù)據(jù)訪問(wèn)性能,算力可用度從30%提升至近50%,不僅避免了算力浪費(fèi),且整體投資回報(bào)顯著增加。

總結(jié)

在當(dāng)今的信息技術(shù)領(lǐng)域,全棧技術(shù)已經(jīng)成為了一個(gè)多層次的復(fù)合體系。它主要由三個(gè)核心組成部分構(gòu)成:云中心、算力中心和存力中心。云中心致力于為各種應(yīng)用提供服務(wù),而算力中心則專注于算法和工具的運(yùn)行和承載。存力中心則是關(guān)鍵的數(shù)據(jù)和數(shù)據(jù)基礎(chǔ)設(shè)施,它是我們能夠掌握在自己手中的寶貴資源。在數(shù)據(jù)基礎(chǔ)設(shè)施方面,我們已經(jīng)做到國(guó)際先進(jìn)水平,擁有自主優(yōu)勢(shì)。高質(zhì)量數(shù)據(jù)基礎(chǔ)設(shè)施不僅是實(shí)現(xiàn)數(shù)據(jù)要素化的基礎(chǔ),也是保障數(shù)據(jù)資產(chǎn)安全的關(guān)鍵。

針對(duì)數(shù)據(jù)最基本的五大特征,包括依附性、易復(fù)制、規(guī)模性、多樣性、流動(dòng)性,存儲(chǔ)業(yè)界已經(jīng)推出了包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)保護(hù)、AI存儲(chǔ)以及介質(zhì)應(yīng)用等一系列產(chǎn)品和解決方案,為用戶提供了安全可靠、簡(jiǎn)單高效的數(shù)據(jù)基礎(chǔ)設(shè)施,充分發(fā)揮數(shù)據(jù)作為基礎(chǔ)資源和創(chuàng)新引擎的價(jià)值。在全球數(shù)據(jù)量爆炸性增長(zhǎng)的今天,擁有強(qiáng)大的數(shù)據(jù)處理和存儲(chǔ)能力,意味著擁有競(jìng)爭(zhēng)的新優(yōu)勢(shì)。未來(lái),隨著技術(shù)的不斷進(jìn)步和應(yīng)用的不斷拓展,數(shù)據(jù)存儲(chǔ)和管理將會(huì)成為信息技術(shù)領(lǐng)域中更加重要的一環(huán)。

附錄:

《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》:https://www.gov.cn/zhengce/2020-04/09/content_5500622.htm

《數(shù)據(jù)要素五論:信息,權(quán)屬,價(jià)值,安全,交易》導(dǎo)論 :https://bda.pku.edu.cn/info/1003/1355.htm

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論