可觀察性平臺能否超越傳統(tǒng)APM?

云原生架構(gòu)實現(xiàn)了更快的軟件開發(fā)生命周期。價值可以更快、更增量地實現(xiàn)。但是,一旦組織大規(guī)模部署,就必須看到更小的、分布式的、相互依賴的部分。移動部件太多,太多可能會出錯,無法對此類環(huán)境進(jìn)行透明和控制。

本文來自開源云中文社區(qū)。

451 Research最近的一份市場洞察報告介紹了Chronosphere可觀察性平臺和功能,并承認(rèn)在當(dāng)今云原生世界中對它們的需求越來越多。

這份名為《Chronosphere旨在控制失控的可觀測性數(shù)據(jù)和成本》的報告也提出了一個問題:市場上是否存在獨立、可擴展和盈利的可觀察能力玩家的長期空間?或者,遺留應(yīng)用程序性能監(jiān)控(APM)供應(yīng)商最終會介入并奪取控制權(quán)嗎?

451項調(diào)查顯示,36%的企業(yè)已經(jīng)在生產(chǎn)中部署了可觀察性工具。另外18%的人目前正在調(diào)研概念驗證。

我們認(rèn)為前者是自然而然的。Chronosphere的創(chuàng)始人,首席執(zhí)行官Martin Mao和首席技術(shù)官Rob Skillington在Uber領(lǐng)導(dǎo)了可觀察性團隊,創(chuàng)建了M3,一個開源、可擴展的遠(yuǎn)程存儲時間序列數(shù)據(jù)庫。

Chronosphere的解決方案是從一開始就設(shè)計出來的,可以在容器上運行的大規(guī)模、基于微服務(wù)的應(yīng)用程序中工作,也可以監(jiān)視在非容器化環(huán)境中運行的單體,這意味著許多企業(yè)中普遍存在的混合環(huán)境可以通過這樣的一個工具進(jìn)行監(jiān)控。鑒于451 Research的分析發(fā)現(xiàn),組織正在尋求減少而不是擴大其可觀察性工具集,這一點尤為重要。

為什么要可觀察性?

由于速度、規(guī)模和效率,世界正在走向云原生。云原生架構(gòu)實現(xiàn)了更快的軟件開發(fā)生命周期。價值可以更快、更增量地實現(xiàn)。但是,一旦組織大規(guī)模部署,就必須看到更小的、分布式的、相互依賴的部分。移動部件太多,太多可能會出錯,無法對此類環(huán)境進(jìn)行透明和控制。

451 Research將可觀察性定義為“結(jié)構(gòu)化事件數(shù)據(jù)的攝取、存儲和分析,用于問題檢測和解決”。可觀測性平臺允許工程師快速集中于背景數(shù)據(jù),以診斷云原生環(huán)境中的問題。

可以說,傳統(tǒng)的APM解決方案根本無法在云原生世界中實現(xiàn)可觀測性。這些遺留解決方案會遇到三個基本問題:

——可擴展性:云原生環(huán)境廣播大量數(shù)據(jù),比傳統(tǒng)的基于虛擬機(VM)的環(huán)境多10到100倍。

——靈活性:云原生應(yīng)用程序及其運行的基于容器的基礎(chǔ)設(shè)施是短暫的。它們只在部署的整個生命周期內(nèi)生存??紤]到今天的實踐,這些生命周期往往很短。

——可靠性:如果測量工具本身的可用性超過99.9%,則無法保證99.9%的正常運行時間服務(wù)級別協(xié)議(SLA)。今天的大多數(shù)APM都無法達(dá)到“三個九”級別的可用性。

這些可伸縮性、靈活性和可靠性的挑戰(zhàn)是筆者稱之為可觀察性工具“期望差距”問題的主要驅(qū)動因素。公司希望他們的可觀察性工具能夠更快地發(fā)現(xiàn)問題(平均檢測時間)、更快地解決問題(平均恢復(fù)時間),并提高響應(yīng)能力。但是,對于正在使用APM或IT基礎(chǔ)設(shè)施監(jiān)控解決方案的公司來說,解決方案可能會落空。

根據(jù)451 Research的數(shù)據(jù),可觀察性工具的期望差距相當(dāng)大:更快的問題檢測速度為20個百分點,更快的問題解決速度為15個百分點,提高響應(yīng)速度為16個百分點。

2345截圖20220826142420.png

為什么選擇Chronosphere?

在報告中,451 Research簡明扼要地闡述了Chronosphere的價值主張:

“該公司的SaaS平臺將開源云監(jiān)控的好處與客戶輸入相結(jié)合,以消除無差別度量和跟蹤的噪音。”

451研究指出,基于Prometheus或OpenTelemetry的自我管理OSS解決方案在從容器化環(huán)境中捕獲度量和跟蹤時可以很好地工作。但它們有許多局限性。首先,隨著應(yīng)用程序的增長,需要更多的工人來支持它們,導(dǎo)致成本上升。

隨著組織試圖擴大規(guī)模,可用性和彈性也是“重大問題”。大量的相互依賴關(guān)系導(dǎo)致數(shù)據(jù)的數(shù)據(jù)基數(shù)更高,并且更迫切地需要基于業(yè)務(wù)度量將基礎(chǔ)設(shè)施連接到應(yīng)用程序。451 Research總結(jié)道,這就是為什么,即使在與基于VM的部署規(guī)模相同的情況下運行,云原生應(yīng)用程序的監(jiān)控費用也會大大增加。

Chronosphere的目標(biāo)是使用控制平面來緩解處理加速數(shù)據(jù)增長的痛苦,以及可觀察性數(shù)據(jù)的成本,該控制平面依賴于聚合和其他技術(shù)來制定保留和解決策略,使客戶只需為他們絕對需要保留的數(shù)據(jù)付費。

此外,正如451 Research所寫,“Chronosphere認(rèn)為,其差異化在于解決面向客戶的問題的根本原因,而不是過分關(guān)注指標(biāo)、日志和跟蹤(這是數(shù)據(jù))-主要活動是反省應(yīng)用程序,以了解發(fā)生了什么。”可以說,Chronosphere關(guān)注的是結(jié)果,而不是數(shù)字本身。

在實踐中,這意味著使用Chronosphere工具,讓工程師專注于解決三個關(guān)鍵問題:

——當(dāng)出現(xiàn)問題時,在負(fù)面客戶或員工體驗之前或之后,能以多快的速度得到通知?

——能多容易、多快地分類問題并了解其影響?

——如何找到根本原因以便解決問題?

通過關(guān)注結(jié)果,可以以多快的速度糾正這種有問題的客戶或員工體驗,而不是輸入(指標(biāo)、日志和跟蹤),Chronosphere平臺以能夠顯著縮短解決問題的時間而聞名。這對于越來越依賴云原生應(yīng)用程序的企業(yè)來說非常重要。

為云原生設(shè)計并構(gòu)建了可觀察性平臺

云原生可觀察性已被證明是傳統(tǒng)APM領(lǐng)域的一股顛覆性力量。451指出,“在企業(yè)應(yīng)對復(fù)雜的云原生應(yīng)用程序所帶來的挑戰(zhàn)時,人們對專門針對云原生技術(shù)設(shè)計的工具也很感興趣。”由于云原生環(huán)境的要求,它在架構(gòu)上和獨特性上有很大的不同。傳統(tǒng)的APM供應(yīng)商無法現(xiàn)實地重新設(shè)計他們的解決方案,使其在這個新世界中工作。

APM可能是企業(yè)基于VM的應(yīng)用程序所需的工具,但可觀察性將為擁有云原生環(huán)境的企業(yè)帶來競爭優(yōu)勢。另一種思考方式是,盡管今天的APM工具是為云設(shè)計的,但可觀察性平臺是為云原生設(shè)計的。這是一個很大的區(qū)別。隨著組織越來越多地轉(zhuǎn)向云原生架構(gòu),像Chronosphere平臺這樣的可觀察性平臺將在使用和交付業(yè)務(wù)成果的效率方面超越APM解決方案。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論