是誰撬動了數(shù)據(jù)存儲的蛋糕

小I同學(xué)
根據(jù)多家機構(gòu)的數(shù)據(jù),2016-2019年,全球云存儲市場維持20%以上的高增速。預(yù)計2022年全球云存儲市場規(guī)模將達到2700億美元以上。雖然云存儲市場的規(guī)模和用戶在飛速增長,但是作為云存儲的主要商業(yè)模式-中心化存儲正暴露出越來越多的缺陷。
          “對數(shù)據(jù)來說,全周期的產(chǎn)權(quán)確認和摩擦成本的降低才能實現(xiàn)數(shù)據(jù)交易價值的最優(yōu)化。”
 
          1、數(shù)據(jù)增長的隱患
 
          數(shù)據(jù)生產(chǎn)創(chuàng)造價值。隨著移動互聯(lián)、社交媒體、物聯(lián)網(wǎng)、云計算、人工智能等數(shù)據(jù)技術(shù)的迅速發(fā)展和深入運用,出現(xiàn)了海量、多樣和即時的數(shù)據(jù)。基于對這些數(shù)據(jù)的分析,人們采取了一系列的決策和行動,從而在消費者市場、流行疾病預(yù)測、交通管理等領(lǐng)域取得了引人注目的成績。這些基于數(shù)據(jù)價值分析的行為逐步的改變我們的生活、學(xué)習、工作的方式,在社會各方面、產(chǎn)業(yè)各領(lǐng)域迅速擴展和滲透。數(shù)據(jù)作為一種有價值的商品正在人類社會中扮演越來越重要的角色。這些有價值的數(shù)據(jù),大量存儲在各大廠商的云端,構(gòu)成了龐大的云存儲市場。
 
 
          根據(jù)多家機構(gòu)的數(shù)據(jù),2016-2019年,全球云存儲市場維持20%以上的高增速。預(yù)計2022年全球云存儲市場規(guī)模將達到2700億美元以上。雖然云存儲市場的規(guī)模和用戶在飛速增長,但是作為云存儲的主要商業(yè)模式-中心化存儲正暴露出越來越多的缺陷。
 
          數(shù)據(jù)無法確權(quán):服務(wù)商缺乏對用戶數(shù)據(jù)的版權(quán)保護手段和動機。
 
          個人隱私保護缺失:現(xiàn)在行業(yè)數(shù)據(jù)非常重要,競爭對手往往會想方設(shè)法的獲取數(shù)據(jù),而將用戶數(shù)據(jù)泄露或出售的行為往往可以讓數(shù)據(jù)存儲服務(wù)商獲得巨大的利益。而且由于文件整體或切片的形式存儲在單一或分布式的網(wǎng)絡(luò)或服務(wù)器上,比較容易被攻擊,數(shù)據(jù)泄露事故也呈逐年上升趨勢,這里面有黑客的攻擊,也有運營方自己惡意造成的。
 
          服務(wù)商跑路風險:現(xiàn)在的云存儲市場競爭也非常激烈,由于用戶數(shù)的上升,為了保證良好的用戶體驗,導(dǎo)致服務(wù)商成本上升,暫時也沒有很好的盈利手段,因此近年來服務(wù)商跑路或是停止服務(wù)的新聞屢見不鮮,用戶卻無法對服務(wù)商的行為有任何約束和索賠的行為。這就造成用戶往往傾向于將數(shù)據(jù)存儲在規(guī)模更大,更有信用的服務(wù)商處,數(shù)據(jù)集中化程度越來越高。
 
          數(shù)據(jù)變現(xiàn)困難:由于中心化存儲的空間,帶寬都是為服務(wù)商為自己的業(yè)務(wù)購買的,保存的數(shù)據(jù)無法利用這些基礎(chǔ)設(shè)施參與市場行為,同時存儲的數(shù)據(jù)沒有版權(quán)機制,數(shù)據(jù)的價值化路徑不確定,流動性降低,交換受限的數(shù)據(jù)價值不高。
 
          2、數(shù)據(jù)持久化與流動的割裂
 
          正因為上面這些問題,產(chǎn)生了數(shù)據(jù)孤島問題。在現(xiàn)有的中心化存儲中,是以網(wǎng)盤/軟件/應(yīng)用為中心的設(shè)計,各個服務(wù)商之間,各個企業(yè)部門之間,各個用戶邏輯空間內(nèi)獨立存儲,獨立維護,相互孤立。由于缺乏確權(quán)機制,網(wǎng)絡(luò)協(xié)議沒有統(tǒng)一標準,不同的服務(wù)商之間有不同的數(shù)據(jù)維護方式,對數(shù)據(jù)交換過程中的一致性認定也不統(tǒng)一,網(wǎng)絡(luò)資源之間的分潤關(guān)系等更是難以協(xié)調(diào)的矛盾,造成數(shù)據(jù)共享的常態(tài)經(jīng)常是數(shù)據(jù)持久層->用戶層->數(shù)據(jù)持久層,產(chǎn)生高昂的交易費用和時間成本。為了解決數(shù)據(jù)孤島,人們開始使用去中心化協(xié)議、區(qū)塊鏈技術(shù)來對數(shù)據(jù)進行確權(quán),對共享數(shù)據(jù)進行激勵。
 
          現(xiàn)有大概三種去中心化的解決方案:
 
          偏中心化的存儲方案:這種類型的方案一般是早期分布式存儲與區(qū)塊鏈結(jié)合的產(chǎn)物,用戶通過出租自己的空間給運營商,運營商通過中心化的運營和區(qū)塊鏈代幣機制來進行用戶分潤,使得用戶獲得類似于中心化存儲的體驗,同時存儲費用大大降低。但由于是中心化運營,除了存儲費用大大下降外,無法解決上面的四個問題。
 
          去中心化存儲協(xié)議:去中心化存儲是一種通過分布式存儲技術(shù)將文件或分片存儲在不同生態(tài)參與方提供的空間上的存儲模式。它主張隱私保護、低成本、數(shù)據(jù)冗余備份、高速共享等價值主張、程序開源,社區(qū)治理模式,有利于規(guī)避單點故障和數(shù)據(jù)的價值傳遞。針對上面的中心化存儲的問題,去中心化存儲基于區(qū)塊鏈技術(shù),通過鏈外存儲和API接口,使得存儲網(wǎng)絡(luò)的TPS在現(xiàn)有公有鏈和聯(lián)盟鏈的基礎(chǔ)上得到大幅改善;并且,通過對生態(tài)參與方進行激勵和懲罰措施,使其遵守一定的運營規(guī)則,不需要或很少需要中心化治理機構(gòu)。由于版權(quán)得到區(qū)塊鏈的確權(quán),數(shù)據(jù)價值可以在鏈上自由流動。并且擁有一定的共享能力,在多個節(jié)點完成相互共享數(shù)據(jù)分片的過程中,實現(xiàn)分片在存儲節(jié)點之外的共享分發(fā),并不斷擴大該文件共享網(wǎng)絡(luò)中的節(jié)點數(shù)。因此,去中心化存儲系統(tǒng)彌補了中心化存儲系統(tǒng)傳輸速度慢的缺陷,同時克服了單點故障并保證了數(shù)據(jù)的安全性。但由于數(shù)據(jù)分片在存儲協(xié)議中以DHT表的形式存在,通過中心化的檢索服務(wù)來尋找數(shù)據(jù),同時由于數(shù)據(jù)上鏈,各種交易費的存在,造成摩擦成本較高,而且在共享分發(fā)過程中的節(jié)點也沒有很好的激勵措施,比較適合存儲存取不是特別頻繁的“冷”數(shù)據(jù)。
 
          去中心化共享協(xié)議:這類協(xié)議以BT協(xié)議為代表,存儲網(wǎng)絡(luò)采用P2P的模式,檢索協(xié)議采用DHT+中心化traker的方式,方便用戶檢索數(shù)據(jù),交易費幾乎沒有,所以引來大量的用戶參與。但是現(xiàn)有的共享協(xié)議網(wǎng)絡(luò),對于數(shù)據(jù)存儲沒有確定的持久性協(xié)議,對于數(shù)據(jù)交換也沒有明確的價值轉(zhuǎn)移通道,單純通過在線時間,計量共享貢獻的模式獲得激勵,雖然解決了共享過程中的資源囚徒困境,但工作量缺乏全網(wǎng)共識,尚沒有比較合理的經(jīng)濟模型設(shè)計。同時對于數(shù)據(jù)權(quán)益也缺乏控制,因此無法在合規(guī)前提下對版權(quán)數(shù)據(jù)進行共享分發(fā)。由于共享經(jīng)濟的特性,熱度高的數(shù)據(jù)會得到大量的分布,偏冷的數(shù)據(jù)則沒有動力去維護,甚至在網(wǎng)絡(luò)中“消失”,所以比較適合“熱”數(shù)據(jù)存儲。
 
          可以看到,現(xiàn)有的存儲/共享協(xié)議或多或少的解決了中心化存儲的諸多問題,但是還是不能在可用性和性價比上勝過中心化存儲模式,究其原因,除了加密經(jīng)濟學(xué)設(shè)計問題以及社區(qū)項目方目標不協(xié)調(diào)之外,主要的問題還在于對于數(shù)據(jù)持久化與流轉(zhuǎn)的設(shè)計理念上的不足。這些協(xié)議在存儲和共享功能層解決了信任問題和激勵問題,但是數(shù)據(jù)持久化和流轉(zhuǎn)是一個閉環(huán)邏輯,整個鏈路上對某個環(huán)節(jié)考慮的缺失,將對整個平臺的可用性造成影響。DSP Labs從一開始就發(fā)現(xiàn)了這個問題,于是我們試著從另一個角度來看整個問題。
 
          3、數(shù)據(jù)的全生命周期與科斯定律
 
          首先,數(shù)據(jù)是有價值的。數(shù)據(jù)的價值在于對于不同的消費者,可以通過對數(shù)據(jù)不斷的分析,不斷的學(xué)習,從而指導(dǎo)接來下策略和行動,從這個角度看,數(shù)據(jù)是很重要的資源。作為資源,數(shù)據(jù)也可以在經(jīng)濟活動中流轉(zhuǎn),在不斷的價值交換過程中實現(xiàn)其最大的價值。通過科斯定律,DSP Labs從數(shù)據(jù)生命周期中得到一些啟發(fā)。
 
 
          “科斯定律:只要財產(chǎn)權(quán)是明確的,并且交易成本為零或者很小,那么,無論在開始時將財產(chǎn)權(quán)賦予誰,市場均衡的最終結(jié)果都是有效率的,實現(xiàn)資源配置的帕累托最優(yōu)。”
 
          這里我們需要確定的財產(chǎn)權(quán)是數(shù)據(jù)的歸屬權(quán),交易成本是狀態(tài)轉(zhuǎn)移的摩擦成本??扑苟筛嬖V我們,對數(shù)據(jù)來說,全周期的產(chǎn)權(quán)確認和摩擦成本的降低才能實現(xiàn)數(shù)據(jù)交易價值的最優(yōu)化。根據(jù)上面三個去中心化協(xié)議來分析,偏中心化方案,對于數(shù)據(jù)的生成,持久化并沒有好的產(chǎn)權(quán)確認方案,大部分還是基于自身運營的數(shù)據(jù)和服務(wù)商的信用來保證。沒有確權(quán)這個前提,交換就存在價值確權(quán)不明晰的問題,對后期數(shù)據(jù)確權(quán)造成很大的問題,不利于數(shù)據(jù)流轉(zhuǎn)。數(shù)據(jù)流轉(zhuǎn)獲得價值。而去中心化存儲協(xié)議在產(chǎn)權(quán)界定方面做得不錯,產(chǎn)權(quán)界定確定權(quán)益分配。部分項目對前三階段都能確定產(chǎn)權(quán),做到利益分配,第四階段則大部分在消費者內(nèi)部完成,不對整個鏈條輸出價值。雖然確權(quán)做的不錯,但是去中心化存儲協(xié)議還是存在摩擦成本過高的問題,即鏈上交易費,檢索費用過高的問題。共享協(xié)議則在兩方面都還有很長的路要走。
 
          可見,數(shù)據(jù)生命周期產(chǎn)權(quán)界定不清和摩擦成本過高制約了整個數(shù)據(jù)價值化的的閉環(huán)邏輯。
 
          4、可能更優(yōu)的策略
 
          DSP Labs試著從整個數(shù)據(jù)生命周期的角度重新來設(shè)計協(xié)議。
 
          首先,我們需要明確各個階段的數(shù)據(jù)產(chǎn)權(quán)。
 
          利用區(qū)塊鏈,我們可以實現(xiàn)對數(shù)據(jù)所有權(quán)的確認,包括版權(quán)。在區(qū)塊鏈不可篡改,全網(wǎng)統(tǒng)一的分布式賬本中,會詳細記錄數(shù)據(jù)創(chuàng)建的時間,位置,屬性,所有者等等一系列的信息,還可以保存數(shù)據(jù)分發(fā)權(quán)限,對數(shù)據(jù)做到產(chǎn)權(quán)明晰,權(quán)限可控。這是實現(xiàn)數(shù)據(jù)流轉(zhuǎn)價值的基礎(chǔ)。因此,在持久化階段,基于分塊的可擴展的分布式存儲網(wǎng)絡(luò)必不可少,不僅完成了存儲功能,同時也是后面數(shù)據(jù)流轉(zhuǎn)的參與者。
 
          服務(wù)承諾
 
          數(shù)據(jù)持久化和流轉(zhuǎn)階段的數(shù)據(jù)產(chǎn)權(quán)也需要確認。在持久化期間,用戶通過存儲費用的方式購買了服務(wù)節(jié)點的服務(wù),服務(wù)節(jié)點需要對用戶的數(shù)據(jù)做出完整性的承諾,這個承諾在區(qū)塊鏈上表明了持久化期間數(shù)據(jù)的產(chǎn)權(quán)關(guān)系。而在流轉(zhuǎn)過程中,也需要對流轉(zhuǎn)的數(shù)據(jù)進行產(chǎn)權(quán)界定,即在數(shù)據(jù)分享過程進行可全網(wǎng)共識驗證的支付承諾,收到數(shù)據(jù)的一方向另一方支付數(shù)據(jù)費用,代表了數(shù)據(jù)權(quán)益的一種轉(zhuǎn)移。
 
          分享過程中,由于有支付承諾,可以對鏈路涉及的節(jié)點進行激勵,因此可以大大提高其他節(jié)點的積極性,積極參與到整個共享過程中來。而且由于數(shù)據(jù)的支付承諾是由區(qū)塊鏈來負責共識結(jié)算的,因此無謂的重復(fù)傳輸,并不會給節(jié)點帶來額外的收益,避免了資源的浪費。
 
          代理承諾
 
          此外我們又引入代理網(wǎng)絡(luò)協(xié)議。代理網(wǎng)絡(luò)為大量在二層網(wǎng)絡(luò)之下,無法提供穩(wěn)定的網(wǎng)絡(luò)地址的設(shè)備提供了一種數(shù)據(jù)流轉(zhuǎn)的途徑。一來降低了接入門檻(成本),引入了大量的邊緣設(shè)備,二來為數(shù)據(jù)的流轉(zhuǎn)增加了固定的服務(wù)節(jié)點,提高了系統(tǒng)的可用性。同樣,根據(jù)服務(wù)承諾的要求,代理網(wǎng)絡(luò)需要數(shù)據(jù)代理承諾來得到數(shù)據(jù)轉(zhuǎn)移分潤。其實這也是降低摩擦成本(增加數(shù)據(jù)交換成功率)的一種方式。
 
 
          降低摩擦成本
 
          在數(shù)據(jù)持久化和流轉(zhuǎn)過程中,摩擦成本來自于這幾個方面:鏈上交易手續(xù)費,第三方數(shù)據(jù)檢索費用,區(qū)塊鏈賬本可能的分叉造成的數(shù)據(jù)回退。
 
          由于鏈上交易手續(xù)費的存在,不能頻繁的調(diào)用鏈上邏輯,因為這樣會造成摩擦成本過高。鏈下支付,鏈上結(jié)算的layer2高速支付協(xié)議,則可以高效率的完成鏈下的分塊共享支付邏輯,同時減低鏈上結(jié)算的成本。此外將文件的分塊映射信息用區(qū)塊鏈合約進行管理,并在實現(xiàn)layer2支付協(xié)議的節(jié)點上提供分布式的合約檢索服務(wù)。每一個數(shù)據(jù)接收方,在收到數(shù)據(jù)的同時,可以將自己擁有的數(shù)據(jù)分塊信息在支付節(jié)點上進行公開,其他節(jié)點可以迅速得到分片信息,并通過支付的方式得到該數(shù)據(jù)分片,并進一步廣播分片信息,這個過程大大提高了分享的效率。同時支付網(wǎng)絡(luò)和檢索服務(wù)進行了合并,用戶不需要費用即可進行檢索服務(wù),支付網(wǎng)絡(luò)也沒有作惡的動機,因為這會影響它的支付承諾分潤。
 
          強一致性的共識網(wǎng)絡(luò)
 
          最后,我們需要一個快速收斂的,效率高,強一致性的共識網(wǎng)絡(luò),來降低數(shù)據(jù)回退的風險。如果存在數(shù)據(jù)分叉或是回退的風險,那么整個平臺確認交易的延時會非常高,時間成本也是一種很重要的摩擦成本,此外業(yè)務(wù)流程也會因此取消或超時,這將影響整個網(wǎng)絡(luò)的功能體驗。
 
          5、結(jié)語
 
          數(shù)據(jù)生產(chǎn)創(chuàng)造了大量價值,中心化存儲的商業(yè)模式存在一系列的隱患。
 
          現(xiàn)有的去中心化協(xié)議或多或少的修補了中心化存儲的弊端,利用區(qū)塊鏈明確了用戶對數(shù)據(jù)的所有權(quán),這是數(shù)據(jù)流轉(zhuǎn)的基礎(chǔ)。
 
          根據(jù)數(shù)據(jù)生命全周期模型,DSP Labs利用科斯定律重新設(shè)計了一個可能更優(yōu)的分布式數(shù)據(jù)協(xié)議,包括:
 
          基于分塊的可擴展的分布式的存儲協(xié)議
 
          鏈下支付,鏈上結(jié)算的二層高速支付網(wǎng)絡(luò)
 
          基于區(qū)塊鏈的地址映射邏輯和分布式的數(shù)據(jù)檢索方式
 
          為了降低網(wǎng)絡(luò)接入門檻的代理網(wǎng)絡(luò)協(xié)議
 
          一致性更好,效率更高的區(qū)塊鏈網(wǎng)絡(luò)
 
          最后,數(shù)據(jù)生成創(chuàng)造價值,數(shù)據(jù)流轉(zhuǎn)獲得價值。
THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論