基礎(chǔ)準備
Excel數(shù)據(jù)分析工具包提供了19種數(shù)據(jù)分析工具,編者根據(jù)統(tǒng)計學內(nèi)容,做了簡單的分類,方便大家使用,今篇介紹第一個:“描述統(tǒng)計”。
之前介紹(回顧:),數(shù)據(jù)分析需要先對數(shù)據(jù)信息從三個方面做初了解:集中趨勢(回顧:),離散程度(回顧:)和分布形狀(),每個方面都有各自的幾種指標:
Excel統(tǒng)計描述
在Excel分析工具介紹(回顧:)中已經(jīng)介紹過如何調(diào)用出分析工具,這里就不在贅述。
Excel描述統(tǒng)計的內(nèi)容也是從集中趨勢、離散程度和分布形狀來闡述數(shù)據(jù)的信息,除此之外標準差公式excel有兩個,還提供了兩項推斷統(tǒng)計結(jié)果和其它輔助結(jié)果:
集中趨勢
該描述統(tǒng)計集中趨勢的描述指標,主要有均值、中位數(shù)和眾數(shù)。數(shù)值含義和計算公式比較簡單,可以回顧:。大家可以用中介紹的公式計算出結(jié)果,再與用Excel函數(shù)計算的結(jié)果對比。
如果單獨用Excel計算,可以使用函數(shù):
均值:();
中位數(shù):();
眾數(shù):mode()
離散程度
離散程度指標(回顧:)中:最大值,最小值和區(qū)域(最大值-最小值)都比較容易理解;需要重點說明的是標準差和方差,這里默認的是樣本的標準差和方差,所以分母是自由度(n-1),而不是總體標準差方差的n。大家可以用中介紹的公式計算出結(jié)果,再與用Excel函數(shù)計算的結(jié)果對比。
Excel函數(shù):
最大值:Max();
最小值:Min();
標準差(樣本):STDEV.S();
標準差(總體):STDEV.P();
方差(樣本):VAR.S();
方差(總體):VAR.P();
分布形狀
數(shù)據(jù)分布形狀涉及到兩個指標:峰度和偏度(回顧:);這兩個指標都是與正態(tài)分布對比得到,與回顧文章中提到的SPSS一樣,Excel計算得出的峰度也是減去3后的結(jié)果,所以0是界限。峰度和偏度是數(shù)據(jù)集正態(tài)性的體現(xiàn),如果數(shù)據(jù)偏離0很遠,可以斷定不是正態(tài)分布的,如果偏離不遠,可以用直方圖、正態(tài)分布概率紙和擬合優(yōu)度檢驗進行進一步的檢驗。
Excel函數(shù):
峰度:KURT();
偏度:SKEW();
推斷統(tǒng)計
在Excel統(tǒng)計描述中包含兩個推斷統(tǒng)計的指標:標準誤差和置信度(置信水平可調(diào)整);這兩個指標是基于假設(shè):總體是正態(tài)總體且總體方差未知的情況,之前介紹過(回顧:),這種情況下,需要用到t分布來進行參數(shù)估計和假設(shè)檢驗,Excel描述統(tǒng)計結(jié)果的標準誤差和置信度就是基于以上結(jié)果計算得出:
標準誤差(又叫總體標準差)等于離散程度的標準差除以根號樣本容量。這是因為總體方差(標準差)未知,所以用樣本標準差來代替總體標準差進行估計(樣本標準差是總體標準差的優(yōu)良估計,回顧:)。公式如下:
置信度:如果要求的是95%的置信水平,可以查t分布表的雙側(cè)檢驗結(jié)果(95%和自由度n-1),得到臨界t值,該值與上方標準誤差的乘積就是該結(jié)果。該結(jié)果的含義就是通過樣本數(shù)據(jù)得到的總體均值區(qū)間估計。公式如下:
Excel函數(shù):
標準誤差:STDEV.S()*SQRT(觀測數(shù))
置信度:T.INV.2T()*標準誤差
其它信息
歸類為其它信息的有求和、觀測數(shù)、最大(n)和最下(n)四項,求和和觀測數(shù)容易理解,不做說明。最大(n)和最小(n)的作用:假如分析者需要返回樣本數(shù)據(jù)中第4大或第5小的數(shù)據(jù)時,在相應的參數(shù)輸入格中輸入4和5,結(jié)果就會返回第四大和第五小的數(shù)據(jù)。
Excel函數(shù):
求和:SUM();
觀測數(shù):COUNT();
最大(n):LARGE();
最小(n):SMALL();
范例分析
上方圖片數(shù)據(jù)是編者隨機輸入的23個值,列1表格是用“Excel數(shù)據(jù)分析工具”-“描述統(tǒng)計”計算的結(jié)果,后面兩列分別列出每個結(jié)果對應的Excel函數(shù)和函數(shù)計算結(jié)果,方便大家對照理解。
結(jié)論
Excel數(shù)據(jù)分析工具中提供的統(tǒng)計描述選項能夠快速給出數(shù)據(jù)集的集中趨勢、離散程度和分布形狀等信息,這些信息使數(shù)據(jù)分析者能夠?qū)?shù)據(jù)集有大致理解,然后可以進行針對性的其它數(shù)據(jù)分析。
藍色字體設(shè)置超鏈接,直接點擊回顧遺忘知識!!!
有任何疑問標準差公式excel有兩個,請留言!!!