- 相關(guān)推薦
正態(tài)分布圖在數(shù)據(jù)分析中的應(yīng)用例子
當(dāng)我們面對一堆龐大的數(shù)據(jù),且需要從中尋找某種規(guī)律時,往往不知如何下手。最近我在處理油耗數(shù)據(jù)時,就碰到了這樣的難題,偶然間記得概率統(tǒng)計中存在一種比較特殊的數(shù)據(jù)分布方式,即所謂的正態(tài)分布
從維基百科中搜到的結(jié)果是“正態(tài)分布是自然科學(xué)與行為科學(xué)中的定量現(xiàn)象的一個方便模型。各種各樣的心理學(xué)測試分?jǐn)?shù)和物理現(xiàn)象比如光子 計數(shù)都被發(fā)現(xiàn)近似地服從常態(tài)分布。盡管這些現(xiàn)象的根本原因經(jīng)常是未知的, 理論上可以證明如果把許多小作用加起來看做一個變量,那么這個變量服從正態(tài)分布”,如
圖1
既然這樣,那我何不驗(yàn)證一下呢?進(jìn)一步閱讀相關(guān)文章后,對概率統(tǒng)計方法的相關(guān)要求和步驟有了初步的了解,為便于了解,用圖2來表示推斷過程
在總體數(shù)據(jù)量不大的情況下,我傾向于用總體做為分析依據(jù),以減少樣本抽取的誤差
在上圖所示四步中,用統(tǒng)計工具進(jìn)行分析的過程是最需引起重視的,大概有兩點(diǎn):
1.對總體(或樣本)數(shù)據(jù)的分組。由于油耗屬于連續(xù)型變量,不同變量之間的變化非常小,我采用較多數(shù)組的組距分組方式
2.求平均值。數(shù)據(jù)分布不同,平均值的計算方法也有不同,最常用的是算術(shù)平均值,在呈正態(tài)分布的數(shù)據(jù)中,它與中位數(shù)(Median)和眾數(shù)(Mode)的計算結(jié)果基本一致,且概率密度函數(shù)(Normdist)也是默認(rèn)算術(shù)平均值的計算方式
實(shí)際操作一遍:
1.準(zhǔn)備統(tǒng)計數(shù)據(jù)
2.求中間參數(shù)值
3.求頻率(Frequency)和概率(Normdist)
4.用第3步的函數(shù)計算結(jié)果分別作柱形圖和折線圖
5.客觀推論最后得下圖
推論之一:上圖數(shù)據(jù)分布的趨勢比較明顯,油耗值趨向于柱形最高的區(qū)域集中,且波動范圍較小,說明對應(yīng)車輛的油耗比較穩(wěn)定
【正態(tài)分布圖在數(shù)據(jù)分析中的應(yīng)用例子】相關(guān)文章:
淺談信息技術(shù)在數(shù)學(xué)教學(xué)中的應(yīng)用03-03
演講藝術(shù)中思維導(dǎo)圖的應(yīng)用07-03
思維導(dǎo)圖教學(xué)中應(yīng)用心得體會06-14
電子商務(wù)中的數(shù)據(jù)分析指標(biāo)05-24
不怕失敗的例子10-08
《一次函數(shù)圖象的應(yīng)用》評課稿08-11
標(biāo)桿超越法在薪酬與考核中的應(yīng)用04-20
數(shù)據(jù)分析報告07-28