一、概念
什么是數據分析呢?數據分析是指基于商業理論,依賴統計工具,洞悉數據背后的規律,從而為企業創造最大價值。其主要運用在:監控異常的數據、建立模型并預測、關鍵變量分析并預測、預測性分析。
二、數據分析得五個步驟
1、數據收集
當我們進行數據分析時,首先解決的問題就是數據源的問題。分為兩大類。
第一類:直接能夠獲取的數據,也就是內部數據。
第二類:外部數據,經加工整理后獲得數據。
2、數據清理
清洗數據的目的也就是從大量的、雜亂無章的數據中抽取以及推導出對解決問題有價值的、有意義的數據。清洗后保留下來的真正有價值、有條理的數據,為后面的數據分析減少分析障礙。
3、數據對比
對比也就是數據分析的切入口。因為如果沒有參照物的話,數據也就沒有一個定量的評估標準。通常情況下,我們會進行橫向對比和縱向對比。橫向對比,與行業平均數據,和競爭對手數據比較,縱向對比,是與自己家產品的歷史數據比較,圍繞著時間軸比較。
4、數據細分
數據對比出現了異常后,我們該怎么辦呢?這時候就需要用到數據細分了,數據細分通常情況下先分緯度,再分粒度。緯度也就是時間或者是地域、來源、受訪等。粒度也就是按照天、還是按照小時。
而緯度結合粒度進行細分,就可以將對比的差異值逐級鎖定問題區域,就可以更為容易找出發生問題的原因了。
5、數據溯源
通過數據細分基本上我們就可以分析出大多數問題的原因,但也會遇到特殊的情況,因此這時候我們就需要進行進一步的分析,也就是通過數據溯源就能找出問題的原因。依據鎖定的這個緯度和粒度作為搜索條件,查詢所涉及的原日志,源記錄,然后基于此分析和反思用戶的行為,往往會有不一樣的發現。又或者結合用戶使用場景去思考。