- 相關(guān)推薦
數(shù)據(jù)分析六部曲
明確分析的內(nèi)容和目的、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)、報(bào)告撰寫(xiě)等6個(gè)步驟。
明確數(shù)據(jù)分析的目的和內(nèi)容是確保數(shù)據(jù)分析過(guò)程有效的進(jìn)行的先決條件,以便明確數(shù)據(jù)分析方向,保證不迷失方向。
數(shù)據(jù)收集是按照確定的數(shù)據(jù)分析內(nèi)容,收集相關(guān)數(shù)據(jù)的過(guò)程,它為數(shù)據(jù)分析提供了素材和依據(jù)。這里所說(shuō)的數(shù)據(jù)包括第一手?jǐn)?shù)據(jù)與第二手?jǐn)?shù)據(jù),第一手?jǐn)?shù)據(jù)是指可以直接獲取的數(shù)據(jù),第二手?jǐn)?shù)據(jù)是指經(jīng)過(guò)加工整理后得到的數(shù)據(jù)。一般數(shù)據(jù)來(lái)源主要有數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)、公開(kāi)出版物、市場(chǎng)調(diào)查等形式。
數(shù)據(jù)處理:
是指對(duì)收集過(guò)來(lái)的數(shù)據(jù)進(jìn)行加工處理,形成適合分析的樣式,它是數(shù)據(jù)分析必不可少的步驟。數(shù)據(jù)處理基本是從大量的、雜亂無(wú)章、難以理解的數(shù)據(jù)中推導(dǎo)出對(duì)解決問(wèn)題有價(jià)值、有意義的數(shù)據(jù)。(數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)提取、數(shù)據(jù)計(jì)算等方法。)
數(shù)據(jù)分析:
主要是指通過(guò)統(tǒng)計(jì)分析或者數(shù)據(jù)挖掘技術(shù)對(duì)處理過(guò)的數(shù)據(jù)分析,從中發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部關(guān)系和規(guī)律,為解決問(wèn)題提供參考。
數(shù)據(jù)分析與數(shù)據(jù)處理的區(qū)別:數(shù)據(jù)處理是數(shù)據(jù)分析的基礎(chǔ)。通過(guò)數(shù)據(jù)處理,將收集到的原始數(shù)據(jù)轉(zhuǎn)換為可以分析的數(shù)據(jù)形式,并保證數(shù)據(jù)的一致性和有效性。如果數(shù)據(jù)本身存在問(wèn)題,那么即使采用最新進(jìn)的數(shù)據(jù)分析方法,得到的結(jié)果也是錯(cuò)誤的。
數(shù)據(jù)分析與數(shù)據(jù)挖掘的關(guān)系:數(shù)據(jù)挖掘就是一種高級(jí)的書(shū)分析方法,數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,它是根據(jù)用戶的特定要求,從浩瀚如煙的數(shù)據(jù)中找出所需要的數(shù)據(jù),以滿足用戶的需求。數(shù)據(jù)挖掘主要側(cè)重于解決四類數(shù)據(jù)分析問(wèn)題:分類、聚集、關(guān)聯(lián)、預(yù)測(cè)。
數(shù)據(jù)展現(xiàn):
數(shù)據(jù)是通過(guò)表格和圖形的方式呈現(xiàn)出來(lái)的,我們常說(shuō)用圖標(biāo)說(shuō)話就是這個(gè)意思。常用的數(shù)據(jù)圖表包括餅圖、柱形圖、條形圖、折線圖、散點(diǎn)圖、雷達(dá)圖等。也可以對(duì)這些圖進(jìn)行加工,展現(xiàn)出來(lái)我們所需要的圖。一般情況下用圖說(shuō)明問(wèn)題的就不用表格,用表格說(shuō)明問(wèn)題的就不文字。
報(bào)告撰寫(xiě):
數(shù)據(jù)分析報(bào)告其實(shí)就是對(duì)整個(gè)數(shù)據(jù)分析過(guò)程的一個(gè)總結(jié)與呈現(xiàn)。通過(guò)報(bào)告,把數(shù)據(jù)分析的起因,過(guò)程,結(jié)果及建議完整的呈現(xiàn)出來(lái),以供決策者參考。數(shù)據(jù)分析報(bào)告一定要有建議和解決方案,作為決策者,需要的不僅僅是找出問(wèn)題,最重要的是建議和解決方案,以便他們?cè)跊Q策時(shí)候做參考。所以數(shù)據(jù)分析師不僅僅需要掌握數(shù)據(jù)分析的方法,而且還需要了解和熟悉業(yè)務(wù),這樣才能根據(jù)發(fā)現(xiàn)的業(yè)務(wù)問(wèn)題,提出具有可行性的建議和解決方案。
數(shù)據(jù)分析常用的指標(biāo)和術(shù)語(yǔ):
平均數(shù):一般指的是算數(shù)平均數(shù)。算數(shù)平均數(shù)是非常重要的基礎(chǔ)性指標(biāo)。平均數(shù)是綜合指標(biāo),它的特點(diǎn)是將總體內(nèi)各單位的數(shù)量差異抽象化,代表總體的一邊水平,掩蓋總體內(nèi)各單位的差異。
絕對(duì)數(shù)與相對(duì)數(shù)
絕對(duì)數(shù)是反映客觀現(xiàn)象總體在一定時(shí)間、地點(diǎn)條件下的總規(guī)模、總水平的綜合性指標(biāo)。也就是數(shù)據(jù)分析中的常用指標(biāo),如:GDP,總?cè)丝诘取?/p>
相對(duì)數(shù)是指由倆個(gè)有聯(lián)系的指標(biāo)對(duì)比計(jì)算而得到的數(shù)值,它是反映客觀現(xiàn)象之間數(shù)量連續(xù)程度的綜合指標(biāo)。計(jì)算相對(duì)數(shù)的基本公式:相對(duì)數(shù)=比較數(shù)值(比數(shù))/基礎(chǔ)數(shù)值(基數(shù))
說(shuō)明:分母就是用作對(duì)比標(biāo)準(zhǔn)的指數(shù)數(shù)值,簡(jiǎn)稱基數(shù)。分鐘是用做與基數(shù)對(duì)比的指數(shù)數(shù)值,簡(jiǎn)稱比數(shù)。相對(duì)數(shù)一般以倍數(shù)、成數(shù)、百分?jǐn)?shù)等表示,它反映了客觀現(xiàn)象之間數(shù)量聯(lián)系的程度。
百分比與百分點(diǎn):百分比是相對(duì)數(shù)的一種,它表示一個(gè)數(shù)是另一個(gè)數(shù)的百分之幾,也稱百分率或者百分?jǐn)?shù)。百分比通常采用百分號(hào)來(lái)表示。由于百分比的分母都是100,也就是以1%作為度量單位,由于比較便捷,被廣泛應(yīng)用。百分點(diǎn)是指不同的時(shí)期以百分?jǐn)?shù)的形式表示的相對(duì)指標(biāo)的變動(dòng)幅度。
頻數(shù)與頻率:頻數(shù)是指一組數(shù)據(jù)中個(gè)別數(shù)據(jù)重復(fù)出現(xiàn)的次數(shù)。頻率是指每組類別次數(shù)與總次數(shù)的比值,它代表某類別在總體中出現(xiàn)的頻繁程度,一邊用百分?jǐn)?shù)表示。
比例與比率:比例是指在總體中各部分的數(shù)值占全部數(shù)值的比重,通常反映總體的構(gòu)成和結(jié)構(gòu)。比率是指不用類別數(shù)值的對(duì)比,它反映的不是部分與整體之間的關(guān)系,而是一個(gè)整體各部分之間的關(guān)系。
倍數(shù)與番數(shù):倍數(shù)與番數(shù)同樣屬于相對(duì)數(shù)。倍數(shù)是一個(gè)數(shù)吃了另一個(gè)數(shù)所得的商,倍數(shù)一般是表示數(shù)量增長(zhǎng)或上升幅度而不適用于表示數(shù)量的減少或者下降。番數(shù)是指原來(lái)數(shù)量的2的N次方倍。
同比和環(huán)比:同比是指與歷史同期進(jìn)行比較得到的值,該指標(biāo)主要是反映的是事物發(fā)展的相對(duì)情況。環(huán)比是指與前一個(gè)統(tǒng)計(jì)期進(jìn)行比較得到的值,該指標(biāo)主要是反映的是事物逐漸發(fā)展的情況。
[數(shù)據(jù)分析六部曲]相關(guān)文章:
【數(shù)據(jù)分析六部曲】相關(guān)文章:
數(shù)據(jù)分析三部曲07-10
游戲數(shù)據(jù)分析三步曲07-10
數(shù)據(jù)分析與辦公軟件:數(shù)據(jù)分析方法07-10
數(shù)據(jù)分析07-10
電子商務(wù)企業(yè)數(shù)據(jù)分析三部曲07-10