- 相關(guān)推薦
數(shù)據(jù)整理分析方法
我們要使學(xué)生會(huì)進(jìn)行簡(jiǎn)單的數(shù)據(jù)整理,能把整理的數(shù)據(jù)填入統(tǒng)計(jì)表。下面小編為你整理的數(shù)據(jù)整理分析方法,希望對(duì)你有所幫助!
數(shù)據(jù)整理分析方法
1、聚類(lèi)分析
聚類(lèi)分析指將物理或抽象對(duì)象的集合分組成為由類(lèi)似的對(duì)象組成的多個(gè)類(lèi)的分析過(guò)程。聚類(lèi)是將數(shù)據(jù)分類(lèi)到不同的類(lèi)或者簇這樣的一個(gè)過(guò)程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。聚類(lèi)分析是一種探索性的分析,在分類(lèi)的過(guò)程中,人們不必事先給出一個(gè)分類(lèi)的標(biāo)準(zhǔn),聚類(lèi)分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類(lèi)。聚類(lèi)分析所使用方法的不同,常常會(huì)得到不同的結(jié)論。不同研究者對(duì)于同一組數(shù)據(jù)進(jìn)行聚類(lèi)分析,所得到的聚類(lèi)數(shù)未必一致。
2、因子分析
因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù)。因子分析就是從大量的數(shù)據(jù)中尋找內(nèi)在的聯(lián)系,減少?zèng)Q策的困難。因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對(duì)角線上的值,采用不同的共同性2估值。在社會(huì)學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法。
3、相關(guān)分析
相關(guān)分析(correlation analysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度。相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y分別記一個(gè)人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這就是相關(guān)關(guān)系。
4、對(duì)應(yīng)分析
對(duì)應(yīng)分析(Correspondence analysis)也稱(chēng)關(guān)聯(lián)分析、R-Q型因子分析,通過(guò)分析由定性變量構(gòu)成的交互匯總表來(lái)揭示變量間的聯(lián)系?梢越沂就蛔兞康母鱾(gè)類(lèi)別之間的差異,以及不同變量各個(gè)類(lèi)別之間的對(duì)應(yīng)關(guān)系。對(duì)應(yīng)分析的基本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來(lái)。
5、回歸分析
研究一個(gè)隨機(jī)變量Y對(duì)另一個(gè)(X)或一組(X1,X2,Xk)變量的相依關(guān)系的統(tǒng)計(jì)分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴(lài)的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類(lèi)型,可分為線性回歸分析和非線性回歸分析。
6、方差分析
又稱(chēng)“變異數(shù)分析”或“F檢驗(yàn)”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類(lèi),一是不可控的隨機(jī)因素,另一是研究中施加的對(duì)結(jié)果形成影響的可控因素。方差分析是從觀測(cè)變量的方差入手,研究諸多控制變量中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量。
實(shí)驗(yàn)數(shù)據(jù)的處理自然離不開(kāi)繪制成表。那么,常見(jiàn)的實(shí)驗(yàn)數(shù)據(jù)處理表格體現(xiàn)方式分為兩種:列表法和作圖法。
列表法就是將一組實(shí)驗(yàn)數(shù)據(jù)和計(jì)算的中間數(shù)據(jù)依據(jù)一定的形式和順序列成表格。列表法可以簡(jiǎn)單明確地表示出物理量之間的對(duì)應(yīng)關(guān)系,便于分析和發(fā)現(xiàn)資料的規(guī)律性,也有助于檢查和發(fā)現(xiàn)實(shí)驗(yàn)中的問(wèn)題,這就是列表法的優(yōu)點(diǎn)。設(shè)計(jì)記錄表格時(shí)要做到:
(1)表格設(shè)計(jì)要合理,以利于記錄、檢查、運(yùn)算和分析。
(2)表格中涉及的各物理量,其符號(hào)、單位及量值的數(shù)量級(jí)均要表示清楚。但不要把單位寫(xiě)在數(shù)字后。
(3)表中數(shù)據(jù)要正確反映測(cè)量結(jié)果的有效數(shù)字和不確定度。列入表中的除原始數(shù)據(jù)外,計(jì)算過(guò)程中的一些中間結(jié)果和最后結(jié)果也可以列入表中。
(4)表格要加上必要的說(shuō)明。實(shí)驗(yàn)室所給的數(shù)據(jù)或查得的單項(xiàng)數(shù)據(jù)應(yīng)列在表格的上部,說(shuō)明寫(xiě)在表格的下部。
作圖法是在坐標(biāo)紙上用圖線表示物理量之間的關(guān)系,揭示物理量之間的聯(lián)系。作圖法既有簡(jiǎn)明、形象、直觀、便于比較研究實(shí)驗(yàn)結(jié)果等優(yōu)點(diǎn),它是一種最常用的數(shù)據(jù)處理方法。作圖法的基本規(guī)則是:
(1)根據(jù)函數(shù)關(guān)系選擇適當(dāng)?shù)淖鴺?biāo)紙(如直角坐標(biāo)紙,單對(duì)數(shù)坐標(biāo)紙,雙對(duì)數(shù)坐標(biāo)紙,極坐標(biāo)紙等)和比例,畫(huà)出坐標(biāo)軸,標(biāo)明物理量符號(hào)、單位和刻度值,并寫(xiě)明測(cè)試條件。
(2)坐標(biāo)的原點(diǎn)不一定是變量的零點(diǎn),可根據(jù)測(cè)試范圍加以選擇。坐標(biāo)分格最好使最低數(shù)字的一個(gè)單位可靠數(shù)與坐標(biāo)最小分度相當(dāng)。縱橫坐標(biāo)比例要恰當(dāng),以使圖線居中。
(3)描點(diǎn)和連線。根據(jù)測(cè)量數(shù)據(jù),用直尺和筆尖使其函數(shù)對(duì)應(yīng)的實(shí)驗(yàn)點(diǎn)準(zhǔn)確地落在相應(yīng)的位置。一張圖紙上畫(huà)上幾條實(shí)驗(yàn)曲線時(shí),每條圖線應(yīng)用不同的標(biāo)記如“+”、“×”、“·”、“Δ”等符號(hào)標(biāo)出,以免混淆。連線時(shí),要顧及到數(shù)據(jù)點(diǎn),使曲線呈光滑曲線(含直線),并使數(shù)據(jù)點(diǎn)均勻分布在曲線(直線)的兩側(cè),且盡量貼近曲線。個(gè)別偏離過(guò)大的點(diǎn)要重新審核,屬過(guò)失誤差的應(yīng)剔去。
(4)標(biāo)明圖名,即做好實(shí)驗(yàn)圖線后,應(yīng)在圖紙下方或空白的明顯位置處,寫(xiě)上圖的名稱(chēng)、作者和作圖日期,有時(shí)還要附上簡(jiǎn)單的說(shuō)明,如實(shí)驗(yàn)條件等,使讀者一目了然。作圖時(shí),一般將縱軸代表的物理量寫(xiě)在前面,橫軸代表的物理量寫(xiě)在后面,中間用“~”聯(lián)接。
六大數(shù)據(jù)分析的常見(jiàn)方法
1、對(duì)比分析法
對(duì)比分析法是一種常見(jiàn)的數(shù)據(jù)分析方法。通過(guò)數(shù)據(jù)分析比對(duì),能告訴你過(guò)去發(fā)生了什么(現(xiàn)狀分析)、告訴你某一現(xiàn)狀為什么發(fā)生(原因分析)、告訴你將來(lái)會(huì)發(fā)生什么(預(yù)測(cè)分析)。
對(duì)比分析法是指將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析它們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化情況和規(guī)律性。對(duì)比分析法的特點(diǎn)是:可以非常直觀地看出事物某方面的變化或差距,并且可以準(zhǔn)確、量化地表示出這種變化或差距是多少?
對(duì)比分析法可分為靜態(tài)比較和動(dòng)態(tài)比較兩類(lèi)。靜態(tài)比較是在同一時(shí)間條件下對(duì)不同總體指標(biāo)的比較,如不同部門(mén)、不同地區(qū)、不同國(guó)家的比較、也叫橫向比較,簡(jiǎn)稱(chēng)橫比;動(dòng)態(tài)比較是在同一總體條件下對(duì)不同時(shí)期指標(biāo)數(shù)值的比較,也叫縱向比較,簡(jiǎn)稱(chēng)縱比。
這兩種方法既課單獨(dú)使用,也可結(jié)合使用。進(jìn)行對(duì)比分析時(shí),可以單獨(dú)使用總量指標(biāo)、相對(duì)指標(biāo)或平均指標(biāo),也可將它們結(jié)合起來(lái)進(jìn)行對(duì)比。比較的結(jié)果可用相對(duì)數(shù)表示,如百分?jǐn)?shù)、倍數(shù)等指標(biāo)。
注意事項(xiàng):
指標(biāo)的口徑范圍、計(jì)算方法、計(jì)量單位必須一致,即要用同一種單位或標(biāo)準(zhǔn)去衡量;對(duì)比的對(duì)象要有可比性;對(duì)比的指標(biāo)類(lèi)型必須一致。無(wú)論絕對(duì)數(shù)指標(biāo)、相對(duì)數(shù)指標(biāo)、平均數(shù)指標(biāo),還是其他不同類(lèi)型的指標(biāo),在進(jìn)行對(duì)比時(shí),雙方必須統(tǒng)一。
2、關(guān)聯(lián)分析法
關(guān)聯(lián)分析法是一種十分實(shí)用的分析技術(shù),是從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的關(guān)聯(lián)和相關(guān)關(guān)系,從而描述一個(gè)事務(wù)中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式。
關(guān)聯(lián)分析的一個(gè)典型例子是購(gòu)物籃分析,這是一個(gè)很有趣的典型案例:美國(guó)學(xué)者Agrawal在發(fā)現(xiàn)啤酒和紙尿褲經(jīng)常一起出現(xiàn)在顧客購(gòu)物籃中后,進(jìn)行了研究,發(fā)現(xiàn)原因出自“奶爸”這一群體。首先,從時(shí)間上,周末比工作日購(gòu)買(mǎi)紙尿褲喝啤酒的頻率更多;其次,爸爸們喜歡看體育節(jié)目,而且更愛(ài)邊喝啤酒邊看,且美國(guó)的體育節(jié)目多在周末扎堆。所以,當(dāng)周末母親需要給孩子換紙尿褲時(shí),通常會(huì)讓正在看球的奶爸去買(mǎi)。奶爸出去買(mǎi)紙尿褲,會(huì)順便帶些啤酒回來(lái)。
世間萬(wàn)物之間多多少少會(huì)有一些關(guān)聯(lián),通過(guò)關(guān)聯(lián)分析法,我們可以通過(guò)數(shù)據(jù)挖掘,將這些關(guān)聯(lián)規(guī)則挖掘出來(lái)。
3、漏斗分析法
漏斗分析法是一個(gè)適合業(yè)務(wù)流程比較規(guī)范、周期比較長(zhǎng)、各流程環(huán)節(jié)涉及復(fù)雜業(yè)務(wù)過(guò)程比較多的管理分析工具。例如漏斗圖用于網(wǎng)站中某些關(guān)鍵路徑的轉(zhuǎn)化率的分析,不僅能顯示用戶(hù)從進(jìn)入網(wǎng)站到實(shí)現(xiàn)購(gòu)買(mǎi)的最終轉(zhuǎn)化率,同時(shí)還可以展示整個(gè)關(guān)鍵路徑中每一步的轉(zhuǎn)化率。
單一的漏斗圖無(wú)法評(píng)價(jià)網(wǎng)站某個(gè)關(guān)鍵流程中個(gè)步驟轉(zhuǎn)化率的好壞。我們可以利用之前介紹的對(duì)比分析法,對(duì)同一環(huán)節(jié)優(yōu)化前后的效果進(jìn)行對(duì)比分析,或?qū)ν画h(huán)節(jié)不同細(xì)分用戶(hù)群的轉(zhuǎn)化率作比較,或?qū)ν袠I(yè)類(lèi)似產(chǎn)品的轉(zhuǎn)化率進(jìn)行對(duì)比,等等。
4、帕累托分析
帕累托分析又稱(chēng)ABC分類(lèi)庫(kù)存控制法,平常也稱(chēng)之為二八定律。二八定律是20世紀(jì)初意大利統(tǒng)計(jì)學(xué)家、經(jīng)濟(jì)學(xué)家維爾弗雷多·帕累托提出的:在任何特定群體中,重要的因子通常只占少數(shù),約20%,而不重要的因子則占多數(shù),約80%,因此只要能控制具有重要性的少數(shù)因子即能控制全局。二八定律與 ABC 分類(lèi)法大致相同,都是少數(shù)項(xiàng)目貢獻(xiàn)了大部分價(jià)值。不同之處是ABC 分類(lèi)法將對(duì)象分三類(lèi),而二八分析則為 A、B 兩類(lèi),A 類(lèi)品牌商品占總體的一小部分,貢獻(xiàn)了 80%的銷(xiāo)售額。
ABC分類(lèi)的核心思想:少數(shù)項(xiàng)目貢獻(xiàn)了大部分價(jià)值。以款式和銷(xiāo)售量為例:A 款式數(shù)量占總體 10% ,卻貢獻(xiàn)了 80% 的銷(xiāo)售額。
按照ABC分組對(duì)產(chǎn)品進(jìn)行分類(lèi),根據(jù)產(chǎn)品的效益將其分為三個(gè)等級(jí),這樣就可以有針對(duì)性地投放不同程度的資源,以達(dá)成產(chǎn)出最優(yōu)效益的目的。
5、留存分析法
留存分析是一種用來(lái)分析用戶(hù)參與情況的分析模型,可以用來(lái)衡量產(chǎn)品對(duì)用戶(hù)價(jià)值的高低。留存分析應(yīng)該能夠靈活配置,通過(guò)留存率能夠判斷產(chǎn)品每一個(gè)步驟對(duì)客戶(hù)的粘性,通過(guò)留存分析,能夠宏觀把控用戶(hù)生命周期內(nèi)產(chǎn)品的改善點(diǎn)。留存不僅是個(gè)可以反映客戶(hù)粘性的指標(biāo),更多地反映產(chǎn)品對(duì)用戶(hù)的吸引力。
按照不同周期,留存率分為三類(lèi):
日留存:
第一種是日留存,日留存又可以細(xì)分為以下幾種:
次日留存率:(當(dāng)天新增的用戶(hù)中,第2天還登錄的用戶(hù)數(shù))/第一天新增總用戶(hù)數(shù);
第3日留存率:(第一天新增用戶(hù)中,第3天還有登錄的用戶(hù)數(shù))/第一天新增總用戶(hù)數(shù);
第7日留存率:(第一天新增用戶(hù)中,第7天還有登錄的用戶(hù)數(shù))/第一天新增總用戶(hù)數(shù);
第14日留存率:(第一天新增用戶(hù)中,第14天還有登錄的用戶(hù)數(shù))/第一天新增總用戶(hù)數(shù);
第30日留存率:(第一天新增用戶(hù)中,第30天還有登錄的用戶(hù)數(shù))/第一天新增總用戶(hù)數(shù)。
周留存:
第二種是周留存,以周度為單位的留存率,指的是每個(gè)周相對(duì)于第一個(gè)周的新增用戶(hù)中,仍然還有登錄的用戶(hù)數(shù)。
月留存:
第三種是月留存,以月度為單位的留存率,指的是每個(gè)月相對(duì)于第一個(gè)周的新增用戶(hù)中,仍然還有登錄的用戶(hù)數(shù)。
6、客戶(hù)畫(huà)像分析法
客戶(hù)畫(huà)像分析是衡量客戶(hù)價(jià)值和客戶(hù)創(chuàng)造利益能力的重要工具和手段,通過(guò)將典型客戶(hù)信息標(biāo)簽化,來(lái)更好地對(duì)其開(kāi)展?fàn)I銷(xiāo)活動(dòng)。
RFM模型通過(guò)R(Rencency)近度、F(Frequency)頻度、M(Monetary)額度三個(gè)指標(biāo)將客戶(hù)劃分為8個(gè)類(lèi)別。
通過(guò)RFM,我們可以把客戶(hù)分為8類(lèi),然后就能方便公司針對(duì)不同的特征的用戶(hù)產(chǎn)出相應(yīng)的營(yíng)銷(xiāo)策略。
【數(shù)據(jù)整理分析方法】相關(guān)文章:
數(shù)據(jù)整理分析教學(xué)實(shí)錄07-01
數(shù)據(jù)分析與辦公軟件:數(shù)據(jù)分析方法07-10
多維數(shù)據(jù)分析方法04-07
數(shù)據(jù)分析常用方法07-26
數(shù)據(jù)分析技巧和方法07-10