數(shù)據分析的五個步驟

大數(shù)據科學
數(shù)據對比出現(xiàn)了異常后,我們該怎么辦呢?這時候就需要用到數(shù)據細分了,數(shù)據細分通常情況下先分緯度,再分粒度。緯度也就是時間或者是地域、來源、受訪等。粒度也就是按照天、還是按照小時。

一、概念

什么是數(shù)據分析呢?數(shù)據分析是指基于商業(yè)理論,依賴統(tǒng)計工具,洞悉數(shù)據背后的規(guī)律,從而為企業(yè)創(chuàng)造最大價值。其主要運用在:監(jiān)控異常的數(shù)據、建立模型并預測、關鍵變量分析并預測、預測性分析。

二、數(shù)據分析得五個步驟

1、數(shù)據收集

當我們進行數(shù)據分析時,首先解決的問題就是數(shù)據源的問題。分為兩大類。

第一類:直接能夠獲取的數(shù)據,也就是內部數(shù)據。

第二類:外部數(shù)據,經加工整理后獲得數(shù)據。

2、數(shù)據清理

清洗數(shù)據的目的也就是從大量的、雜亂無章的數(shù)據中抽取以及推導出對解決問題有價值的、有意義的數(shù)據。清洗后保留下來的真正有價值、有條理的數(shù)據,為后面的數(shù)據分析減少分析障礙。

3、數(shù)據對比

對比也就是數(shù)據分析的切入口。因為如果沒有參照物的話,數(shù)據也就沒有一個定量的評估標準。通常情況下,我們會進行橫向對比和縱向對比。橫向對比,與行業(yè)平均數(shù)據,和競爭對手數(shù)據比較,縱向對比,是與自己家產品的歷史數(shù)據比較,圍繞著時間軸比較。

4、數(shù)據細分

數(shù)據對比出現(xiàn)了異常后,我們該怎么辦呢?這時候就需要用到數(shù)據細分了,數(shù)據細分通常情況下先分緯度,再分粒度。緯度也就是時間或者是地域、來源、受訪等。粒度也就是按照天、還是按照小時。

而緯度結合粒度進行細分,就可以將對比的差異值逐級鎖定問題區(qū)域,就可以更為容易找出發(fā)生問題的原因了。

5、數(shù)據溯源

通過數(shù)據細分基本上我們就可以分析出大多數(shù)問題的原因,但也會遇到特殊的情況,因此這時候我們就需要進行進一步的分析,也就是通過數(shù)據溯源就能找出問題的原因。依據鎖定的這個緯度和粒度作為搜索條件,查詢所涉及的原日志,源記錄,然后基于此分析和反思用戶的行為,往往會有不一樣的發(fā)現(xiàn)。又或者結合用戶使用場景去思考。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論