從常見(jiàn)故障考察數(shù)據(jù)中心運(yùn)維 高效辨優(yōu)劣

曾幾何時(shí)616166
曾幾何時(shí)616166
數(shù)據(jù)中心的運(yùn)維與管理工作常常是基礎(chǔ)服務(wù)供應(yīng)商最為重視的部分,也是企業(yè)考量主機(jī)解決方案時(shí)最重要的參考指標(biāo)要素。不過(guò)由于對(duì)未來(lái)不確定性,數(shù)據(jù)中心需要為所有可能性事故做好防范,以確保真正發(fā)生災(zāi)難期間,盡可能地縮短影響時(shí)長(zhǎng),協(xié)助企業(yè)維持無(wú)間斷運(yùn)營(yíng)。

隨著基礎(chǔ)服務(wù)設(shè)施的覆蓋規(guī)模逐漸延伸和背后支援技術(shù)持續(xù)向前,我們看到商業(yè)數(shù)據(jù)化轉(zhuǎn)型的整體趨勢(shì),以及所有企業(yè)將數(shù)據(jù)戰(zhàn)略作為重要部署的內(nèi)容。那么,如何將數(shù)據(jù)與企業(yè)其他資源進(jìn)行整合,并增強(qiáng)企業(yè)的產(chǎn)品與服務(wù)組合,亦成為關(guān)鍵。

數(shù)據(jù)中心作為重要的互聯(lián)網(wǎng)基礎(chǔ)硬件設(shè)施,為數(shù)據(jù)化轉(zhuǎn)型,以至建設(shè)信息社會(huì)提供主要?jiǎng)恿?,通過(guò)為服務(wù)器提供穩(wěn)定可靠的無(wú)間斷運(yùn)作環(huán)境,保障終端用戶對(duì)數(shù)字化服務(wù)的需求,根據(jù)statista統(tǒng)計(jì)研究,預(yù)計(jì)到2021年全球數(shù)據(jù)中心數(shù)量將達(dá)到7200萬(wàn)座。

數(shù)據(jù)中心不但承擔(dān)數(shù)據(jù)傳遞運(yùn)輸、存儲(chǔ)、計(jì)算等等相關(guān)工作,也是現(xiàn)代化信息時(shí)代里與人力資源、自然資源一樣重要的戰(zhàn)略資源。雖然它僅是一個(gè)擁有極大空間的場(chǎng)所,但其內(nèi)部的環(huán)境會(huì)極大程度影響數(shù)據(jù)工作效率,以對(duì)企業(yè)業(yè)務(wù)產(chǎn)生系列影響。

因此,數(shù)據(jù)中心的運(yùn)維與管理工作常常是基礎(chǔ)服務(wù)供應(yīng)商最為重視的部分,也是企業(yè)考量主機(jī)解決方案時(shí)最重要的參考指標(biāo)要素。不過(guò)由于對(duì)未來(lái)不確定性,數(shù)據(jù)中心需要為所有可能性事故做好防范,以確保真正發(fā)生災(zāi)難期間,盡可能地縮短影響時(shí)長(zhǎng),協(xié)助企業(yè)維持無(wú)間斷運(yùn)營(yíng)。

通常而言,數(shù)據(jù)中心常見(jiàn)的故障主要分為硬件故障與系統(tǒng)故障。從硬件故障來(lái)說(shuō),主要事故來(lái)源包括設(shè)備、線路、端口等等,哪一個(gè)部分功能無(wú)法正常發(fā)揮或者運(yùn)作,都會(huì)導(dǎo)致機(jī)房異常和中斷。因此,企業(yè)可以通過(guò)確定機(jī)房?jī)?nèi)所有硬件是否具備冗余,可否在出現(xiàn)問(wèn)題時(shí)進(jìn)行第一時(shí)間更換,作為一個(gè)基本參考指標(biāo)。

除了冗余配置之外,就是是否具備可追蹤硬件的方式,譬如新天域互聯(lián)香港數(shù)據(jù)中心將機(jī)房?jī)?nèi)部所有硬件進(jìn)行明確標(biāo)識(shí),能夠在最快時(shí)間內(nèi)確定故障源,及時(shí)進(jìn)行處理,以避免帶來(lái)嚴(yán)重影響,保證企業(yè)業(yè)務(wù)的持續(xù)性和可靠性。當(dāng)然受惠于人工智能(AI)、物聯(lián)網(wǎng)(IoT)傳感技術(shù)發(fā)展,目前也有智能化硬件管理方案,最大程度通過(guò)自動(dòng)化簡(jiǎn)易數(shù)據(jù)中的管理工作,還能達(dá)成相同效率和效益。

另一方面就是數(shù)據(jù)中心的系統(tǒng)故障,主要涉及電力系統(tǒng)、冷卻系統(tǒng)、滅火系統(tǒng),以及安防系統(tǒng)四大內(nèi)容。與上述硬件相同,所有系統(tǒng)均需具備冗余,這是基礎(chǔ)且必要的。作為備用設(shè)施能夠在意外期間及時(shí)地啟用,以進(jìn)行抵抗。同時(shí)為確保這些冗余系統(tǒng)的有效性,需要定期進(jìn)行檢查和固定演練。

而電力系統(tǒng)與冷卻系統(tǒng)還需企業(yè)更深層次的信息挖掘,例如機(jī)房的供電來(lái)源源于哪一家電力公司,該公司的能源供應(yīng)可靠度指數(shù),以及冷卻系統(tǒng)采取的是風(fēng)扇冷卻,還是空調(diào)冷卻,抑或是水循環(huán)冷卻,因?yàn)槊恳环N不同的系統(tǒng)由不同能源驅(qū)動(dòng),可成為企業(yè)評(píng)判機(jī)房綠色程度、可靠程度的重要指標(biāo)。

總而言之,企業(yè)選擇服務(wù)器或者是數(shù)據(jù)中心的當(dāng)下,也不妨以機(jī)房故障的角度進(jìn)行轉(zhuǎn)換思考,去檢測(cè)該運(yùn)維團(tuán)隊(duì)是否具備良好素質(zhì)和合規(guī)專業(yè)技術(shù),確保自身的基礎(chǔ)設(shè)施配置獲得足夠保障,并能夠借助這些資源充分地利用數(shù)據(jù)化優(yōu)勢(shì),發(fā)展更廣泛業(yè)務(wù)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論