酷知百科網

位置:首頁 > 遊戲數碼 > 電腦

Excel數據分析之描述統計及其涵義

電腦1.83W

描述一列數據的特徵(比如近10年來GDP數據),可以計算出最大值、最小值、平均數、總數、衆數、中位數、方差等數據來進行描述。本文介紹如何利用Excel的數據分析功能一次性計算出這些特徵值,並說明這些特徵值的涵義,以方便應用。

操作方法

(01)點擊如圖所示紅色尖頭1所指向的“數據”,如果出現紅色尖頭2所指向的“數據分析”選項,則直接點擊該項進入數據分析。如果未找到“數據分析”選項,則請點擊下面的連結“Excel選單欄上數據分析功能的調出”所介紹的方法將“數據分析”選項調出。

Excel數據分析之描述統計及其涵義

(02)點擊“數據分析”選項後彈出如圖所示的視窗。如紅色尖頭1所示點擊“描述統計”,再如紅色尖頭2所示點擊“確定”按鈕。

Excel數據分析之描述統計及其涵義 第2張

(03)彈出如圖所示的視窗,點擊紅色長尖頭所指向的紅圈內的方塊。

Excel數據分析之描述統計及其涵義 第3張

(04)出現如圖所示的介面,使用鼠標左鍵選定所需要統計的數據項。本例如圖紅色紅尖頭1所指向的紅框內的數據(使用鼠標左鍵選定),即B1:B21。然後點擊紅色尖頭2所指向的方塊。

Excel數據分析之描述統計及其涵義 第4張

(05)出現如圖所示的視窗。按照圖示將文字前面的勾打上。在“輸出選項”欄選定“輸出區域”,點擊右邊空白方框邊上的小紅尖頭。

Excel數據分析之描述統計及其涵義 第5張

(06)出現如圖所示的介面,在Excel的任意空白處點擊一下(如圖所示紅色尖頭1所指向,本例點擊了D1)。然後點擊如圖紅色尖頭2所指向的方塊,返回到上一步所示的圖示(步驟5)點擊該圖長紅色尖頭所指向的“確定”按鈕。

Excel數據分析之描述統計及其涵義 第6張

(07)最後得到如圖所示的統計結果(即所謂描述統計的結果)。

Excel數據分析之描述統計及其涵義 第7張

(08)上述數據的涵義如下:平均值反映了數據的平均水平。標準誤差是指樣本平均值的“抽樣誤差”。中位數是對數據趨中性的一種描述,是樣本中數據從小到大排列後的中間值。若樣本容量爲奇數,則取中間的數據值,若爲偶數,則取中間兩個數據的平均值。衆數是樣本數據中出現頻率最高的數值。標準偏差是所選樣本的標準差,是衡量數值相對於其平均值的離散程度的指標。方差是標準偏差的平方,同樣是描述數據離散程度的指標。峯度是刻畫測度數據分佈陡緩程度的指標,若峯度>0,則說明其分佈較標準正態分佈曲線更尖銳,也就是數據更向平均值聚集,屬於尖峯分佈;若峯度<0,則說明其較標準正態分佈曲線更寬闊一些,離散程度較大,屬於平峯分佈;若峯度=0,則數據的分佈性狀即爲標準正態分佈曲線。偏度也就是偏態係數,也稱不對稱度,是測度數據分佈的偏斜方向和程度的指標。若偏度>0,則說明其分佈較正態分佈曲線更向右偏,稱爲正偏或右偏,說明存在偏大的極端值,有一條長尾拖在分佈曲線的右端;若偏度<0,則分佈爲負偏或左偏,存在較小的極端值;若偏度=0,則數據的分佈曲線左右對稱。偏度的絕對值越大,說明數據分佈曲線的偏斜程度就越大,偏度=0是就是無偏斜的情況。最大值爲整個數據系列中數值最大的一個,最小值爲數據系列中數值最小的一個,它們刻畫了數據的離散狀況。最大值與最小值之差稱爲極差,它反映了樣本數據整體涵蓋的範圍大小。置信水平表示樣本數據的數值落在某一區間的概率,置信度則爲在一定置信水平的情況下,樣本平均值可能出現的最大偏差,此時,總體平均值的置信區間即爲樣本平均值±置信度,求解置信區間實際上是置信度的求解過程。