人工智能如何提升大數(shù)據(jù)存儲與管理效率?

物聯(lián)網(wǎng)
物聯(lián)網(wǎng)
隨著大數(shù)據(jù)的大量來源以及企業(yè)可用數(shù)據(jù)量的增加,存儲容量規(guī)劃已成為存儲管理員的問題。據(jù)估計,每天產(chǎn)生2.5萬億字節(jié)的數(shù)據(jù)?,F(xiàn)在,如果以神經(jīng)元計算的話,那就是相當(dāng)于2.5億個人類大腦的海量數(shù)據(jù)。而且,相同的估計表明,全球總數(shù)據(jù)的90%是從2016年到2018年生成的。

隨著大數(shù)據(jù)的大量來源以及企業(yè)可用數(shù)據(jù)量的增加,存儲容量規(guī)劃已成為存儲管理員的問題。據(jù)估計,每天產(chǎn)生2.5萬億字節(jié)的數(shù)據(jù)?,F(xiàn)在,如果以神經(jīng)元計算的話,那就是相當(dāng)于2.5億個人類大腦的海量數(shù)據(jù)。而且,相同的估計表明,全球總數(shù)據(jù)的90%是從2016年到2018年生成的。

可以簡單地說,每天生成越來越多的數(shù)據(jù),這正增加了存儲工作負(fù)載的規(guī)模和復(fù)雜性。但是,人工智能可以拯救存儲管理員,幫助他們高效地存儲和管理數(shù)據(jù)。通過使用AI數(shù)據(jù)存儲,供應(yīng)商和企業(yè)可以將存儲管理提升到一個新的水平。而且,存儲管理員可以找到他們目前正在努力管理的指標(biāo)的解決方案。

存儲管理員需要努力的主要指標(biāo)

存儲管理員在管理存儲問題時面臨一些挑戰(zhàn)。而且,如果他們克服了這些挑戰(zhàn),將幫助他們在數(shù)據(jù)存儲的各個方面之間找到適當(dāng)?shù)钠胶?,例如在哪里分配工作?fù)載,如何分配工作負(fù)載以及如何優(yōu)化堆棧等等。

一般而言,吞吐量是指處理某事物的速率。在網(wǎng)絡(luò)級別,吞吐量的度量單位是Mbps(兆位/秒),而在存儲級別,吞吐量的度量單位是MB /秒(兆字節(jié)/秒)。由于一個字節(jié)等于八兆位,因此生產(chǎn)率在存儲級別上提高了。并且,變得難以管理提高的生產(chǎn)率。

延時

延遲是服務(wù)器完成請求所花費(fèi)的時間。關(guān)于存儲,這是指滿足單個存儲塊的請求所花費(fèi)的時間。存儲塊或塊存儲是將數(shù)據(jù)存儲在卷中的塊。純延遲不受吞吐量影響,但是如果單個塊請求很大,則應(yīng)用延遲可能會隨著吞吐量的增加而偏離。

IOPS(每秒輸入/輸出操作)

IOPS是指存儲堆棧每秒可以處理的離散讀寫任務(wù)的數(shù)量。存儲堆棧是一種允許過程調(diào)用的數(shù)據(jù)結(jié)構(gòu)。這意味著將多個過程彼此存儲在堆棧中,然后在調(diào)用和返回的基礎(chǔ)上一個接一個地執(zhí)行所有過程。例如,如果一個過程被調(diào)用,它將被執(zhí)行,然后返回,以便在堆棧中調(diào)用下一個過程。而且,在談?wù)揑OPS時,基礎(chǔ)輸入/輸出任務(wù)可以達(dá)到存儲系統(tǒng)的堆棧限制。例如,讀取一個大文件和多個小文件可能會對IOPS產(chǎn)生影響。由于讀取單個大文件僅需要執(zhí)行一個讀取任務(wù),因此可以以較高的速度執(zhí)行它,而另一方面,讀取多個文件的速度非常慢,因為需要執(zhí)行許多讀取任務(wù)。

AI數(shù)據(jù)存儲如何解決存儲問題

企業(yè)管理員和存儲供應(yīng)商處理各種各樣的存儲類型。而且,它們還滿足不同輸入/輸出服務(wù)的指標(biāo)。大型文件共享應(yīng)用可能需要適當(dāng)?shù)耐掏铝?,但也必須允許延遲損失,因為大型而復(fù)雜的應(yīng)用可能會對延遲產(chǎn)生不利影響。另一方面,電子郵件服務(wù)器可能需要大量存儲,低延遲和良好的吞吐量,但它可能不需要非常苛刻的IOPS配置文件。并且,存儲管理員應(yīng)該決定應(yīng)該為哪些存儲分配什么資源。因此,在組織中運(yùn)行著成千上萬的服務(wù)時,對基礎(chǔ)存儲的管理超過了人們進(jìn)行明智更改的能力。而且,這就是AI算法派上用場的地方。

人工智能支持的存儲管理和計劃

AI可以監(jiān)控存儲以檢測多種工作負(fù)載的模式和性能。這里的工作負(fù)載是由各種輸入/輸出特征或應(yīng)用任務(wù)生成的數(shù)據(jù)流。通過檢測這些工作負(fù)載模式,AI可以幫助存儲管理員洞悉哪些工作負(fù)載可能使他們面臨最大化存儲陣列的風(fēng)險。此外,存儲監(jiān)視還可以幫助了解是否有任何額外的工作負(fù)載可以放入陣列中。而且,如果添加到陣列中,那么工作負(fù)載將造成多少中斷。

例如,假設(shè)一家企業(yè)正在向流程中添加電子郵件服務(wù)器。在這種情況下,人工智能系統(tǒng)可以幫助預(yù)測存儲陣列將能夠滿足該服務(wù)器的存儲需求還是將其最大化。借助此類技術(shù),存儲管理員可以主動獲取有關(guān)如何將不同的工作負(fù)載分配給不同的存儲堆棧并最大程度地減少延遲的信息。因此,將AI集成到存儲陣列,存儲供應(yīng)商和組織中可以優(yōu)化存儲堆棧。

除了監(jiān)視存儲活動外,存儲管理員還需要檢查和分析存儲系統(tǒng)要使用的應(yīng)用的編碼和錯誤。這有助于他們更好地了解如何圍繞應(yīng)用的需求設(shè)計存儲體系結(jié)構(gòu)。他們通過了解應(yīng)用的輸入/輸出模式來做到這一點。用于執(zhí)行此操作的最常見技術(shù)是捕獲應(yīng)用的跟蹤。

Strace是Linux的用戶空間實用程序,可用于診斷、調(diào)試和獲取有關(guān)輸入和輸出功能的指令。但是,由于復(fù)雜的應(yīng)用可以具有多個輸入/輸出功能,因此這對人類來說可能是一個挑戰(zhàn)。另一方面,ML算法可以輕松地提取和分析大量數(shù)據(jù),并解決許多存儲問題,最好是通過查看存儲系統(tǒng)本身來解決。此外,通過使用大量數(shù)據(jù)訓(xùn)練算法,以了解特定堆棧或整個應(yīng)用如何收集和存儲數(shù)據(jù),它們可以幫助實現(xiàn)對該特定應(yīng)用存儲活動的實時觀察,以防止堆棧最大化并改善存儲容量。

AI數(shù)據(jù)存儲可滿足客戶需求

遙測數(shù)據(jù)是自動記錄和無線傳輸來自遠(yuǎn)程或不可訪問來源的數(shù)據(jù)。遙測以下列方式起作用:傳感器在源處測量數(shù)據(jù),它們將其轉(zhuǎn)換為電壓,然后將其與定時數(shù)據(jù)合并為單個數(shù)據(jù)流,該數(shù)據(jù)流將傳輸?shù)竭h(yuǎn)程接收器。接收后,可以根據(jù)用戶要求對數(shù)據(jù)進(jìn)行處理。

AI的計算機(jī)視覺技術(shù)可以掃描遙測數(shù)據(jù),以保護(hù)存儲陣列免受漏洞侵害。當(dāng)使用有關(guān)漏洞的歷史數(shù)據(jù)進(jìn)行訓(xùn)練時,機(jī)器學(xué)習(xí)算法可以將來自各種應(yīng)用程序的傳入數(shù)據(jù)與歷史數(shù)據(jù)進(jìn)行匹配,以發(fā)現(xiàn)漏洞的可能性。因此,借助AI的預(yù)測分析,存儲供應(yīng)商可以著眼于在遇到客戶之前防止存儲問題。

AI數(shù)據(jù)存儲仍處于起步階段,但已經(jīng)顯示出了驚人的結(jié)果。而且,因此云供應(yīng)商和其他存儲管理員正在對AI進(jìn)行越來越多的投資,以使用超融合存儲系統(tǒng)進(jìn)行存儲維護(hù)。采用主流AI數(shù)據(jù)存儲肯定會幫助企業(yè)控制上述所有指標(biāo),并為其客戶提供更好的服務(wù)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論