在數(shù)據(jù)分析過程中我們大多數(shù)是通過柱狀圖、折線圖、餅圖等來展示分析數(shù)據(jù)的差異。
但是當(dāng)我們擁有一批數(shù)據(jù)的時候,比如有500個數(shù)據(jù)指標(biāo),甚至有多組500個指標(biāo)的時候,上述幾個圖表就無能為力了。
面對大量的指標(biāo),而我們又需要了解這些數(shù)據(jù)的特性的時候,這個時候我們就需要對這些數(shù)據(jù)做描述性統(tǒng)計分析。
描述性統(tǒng)計是揭示數(shù)據(jù)分布特征的方式,表達(dá)定量數(shù)據(jù)的方法。包括數(shù)據(jù)的平均分析、集中趨勢、離散程度、頻率分布。
常見的描述性統(tǒng)計指標(biāo)有:
體現(xiàn)集中趨勢的指標(biāo):眾數(shù)、平均數(shù)、分位數(shù)
離散趨勢指標(biāo):極值與極差、平均差、方差、標(biāo)準(zhǔn)差、分位差
分布趨勢指標(biāo):峰態(tài)、偏態(tài)
*上述加粗指標(biāo)為箱形圖能夠展示的指標(biāo)
今天的主角箱形圖,就是一個包含了上述3個趨勢指標(biāo)的一個強(qiáng)大圖形。
箱形圖,又稱為盒式圖或箱線圖,因?yàn)樾螤钕裣渥佣妹?,用于分析一組或多組數(shù)據(jù)的范圍、中心位置和分布。
箱形圖不像柱狀圖、折線圖、餅圖一樣簡單易懂。
但只要我們稍微理解一下一些指標(biāo)的定義,就能很好地應(yīng)用起來。
今天我們可以借助一個例子來學(xué)習(xí)下這個圖形怎么應(yīng)用:
使用箱型圖來分析行業(yè)商品價格的分布特征。
*特別聲明:我們的數(shù)據(jù)來源是天貓生意參謀市場數(shù)據(jù)某個類目的商品TOP榜單。獲取榜單上商品的價格。
首先認(rèn)識一下箱形圖:
【名詞解釋】:
【Q1】:下四分位數(shù),就是指標(biāo)數(shù)值按降序序排行,處于3/4位置的數(shù)值稱為下四分位數(shù)。
【Q2】:中位數(shù),數(shù)值指標(biāo)按降序排行,排1/2位置的數(shù)值稱為中位數(shù)。
【Q3】:上四分位數(shù),數(shù)值指標(biāo)按降序排行,處于1/4位置的數(shù)值稱為上四分位數(shù)。
【IQR】:四分位距離,Q3和Q1的差,稱為四分位距離,公式:IQR=Q3-Q1。
【上邊緣】:上四分位數(shù)加上1.5倍的四分位距離跟數(shù)據(jù)指標(biāo)的最大值相比,取小的那個。上邊緣是上異常值的邊界。計算公式:上邊緣=(Q3 + 1.5 * IQR,MAX)取最小。
【下邊緣】:下四分位數(shù)減去1.5倍的四分位距離跟數(shù)據(jù)指標(biāo)的最小值相比,取大的那個。下邊緣是下異常值的邊界。計算公式:下邊緣 =(Q1 – 1.5 * IQR,MIN)取最大。
【異常值】:處于上下邊緣之外的數(shù)值都是異常值
【平均值】:所有指標(biāo)的算術(shù)平均值。
根據(jù)各個指標(biāo)的定義,我們通過這個圖形就可以直觀看出指標(biāo)的最大、最小、異常值。
平均值、中位數(shù)有分布形態(tài)。這個圖形比較復(fù)雜,但就是由于比較復(fù)雜,才能直觀帶給我們很多的信息。
我們用Excel 來制作箱形圖:
Excel制作箱形圖特別方便快捷
①先選擇左圖的數(shù)據(jù)區(qū)域:
②點(diǎn)擊插入圖表這里右下角小箭頭:
③在所有圖表中選擇箱形圖:
④這樣一個基本的箱形圖就做好了(可以添加多列數(shù)據(jù)做對比):
⑤我們看看實(shí)際例子中,我們能從箱形圖中洞察出什么內(nèi)容:
我們可以直觀獲取到以下信息:
1、價格最低是6.5最高是160,有兩個高異常值。
2、有兩個商品的價格比較突出,超出正常范圍很多,達(dá)到249、171。
3、有一半的商品價格集中在43-92之間,3/4的商品價格都在92以下。
4、價格中位數(shù)是67,平均值跟中位數(shù)比較接近,平均值為72。
以上數(shù)據(jù),就能更清晰地知道自己商品的價格所處的位置。
數(shù)據(jù)分析中箱形圖的用途:
1、開新品定價:開新品的時候,對商品的價格能夠有一個較好的定位。
如果結(jié)合價格段數(shù)據(jù)的增長趨勢,就能決策進(jìn)入哪個商品價格帶比較合適。
2、類目對比:如果多個類目數(shù)據(jù)對比,就能分析出不同類目的客單價分布的差異性。
箱形圖是功能超級強(qiáng)大的一個分析圖形,趕緊使用起來吧,歡迎交流更多數(shù)據(jù)分析內(nèi)容
關(guān)于數(shù)據(jù)銀行的其它功能和應(yīng)用場景,我們會陸續(xù)在后續(xù)的文章分享,關(guān)注我們及時閱讀干貨內(nèi)容
~~~~~~~~~~~~~~~ 作者分割線 ~~~~~~~~~~~~~~
~~~~~~~~~~~~~公司介紹分割線 ~~~~~~~~~~~
「蔚云科技」專注成為一家數(shù)字商業(yè)運(yùn)營服務(wù)商,我們通過數(shù)字商業(yè)洞察、數(shù)字商業(yè)技術(shù)、數(shù)字商業(yè)運(yùn)營三大核心引擎,為客戶提供具有遠(yuǎn)見卓識的商業(yè)增長解決方案。
聚焦用“大數(shù)據(jù)”為企業(yè)提供「選品賦能」服務(wù),賦能企業(yè)。
