- 相關(guān)推薦
分析報告、統(tǒng)計分析和數(shù)據(jù)挖掘的區(qū)別
關(guān)于數(shù)據(jù)挖掘的作用,Berry and Linoff的定義盡管有些言過其實,但清晰的描述了數(shù)據(jù)挖掘的作用!胺治鰣蟾娼o你后見之明 (hindsight);統(tǒng)計分析給你先機 (foresight);數(shù)據(jù)挖掘給你洞察力 (insight)”。
舉個例子說。
你看到孫悟空跟二郎神打仗,然后寫了個分析報告,說孫悟空在柔韌性上優(yōu)勢明顯,二郎神在力氣上出類拔萃,所以剛開始不相上下;結(jié)果兩個人跑到竹林里,在竹子上面打,孫悟空的優(yōu)勢發(fā)揮出來,所以孫悟空贏了。這叫分析報告。
孫悟空要跟二郎神打架了,有個賭徒找你預測。你做了個統(tǒng)計,發(fā)現(xiàn)兩人斗爭4567次,其中孫悟空贏3456次。另外,孫悟空斗牛魔王,勝率是89%,二郎神斗牛魔王勝率是71%。你得出趨勢是孫悟空贏。因為你假設(shè)了這次勝利跟歷史的關(guān)系,根據(jù)經(jīng)驗作了一個假設(shè)。這叫統(tǒng)計分析。
你什么都沒做,讓計算機自己做關(guān)聯(lián)分析,自動找到了出身、教育、經(jīng)驗、單身四個因素。得出結(jié)論是孫悟空贏。計算機通過分析發(fā)現(xiàn)貧苦出身的孩子一般比皇親國戚功夫練得刻苦;打架經(jīng)驗豐富的人因為擅長利用環(huán)境而機會更多;在都遇得到明師的情況下,貧苦出身的孩子功夫可能會高些;單身的人功夫總比同樣環(huán)境非單身的高。孫悟空遇到的名師不亞于二郎神,而打架經(jīng)驗絕對豐富,并且單身,所以這次打頭,孫悟空贏。這叫數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘跟LOAP的區(qū)別在于它沒有假設(shè),讓計算機找出這種背后的關(guān)系,而這種關(guān)系可能是你所想得到的,也可能是所想不到的。比如數(shù)據(jù)挖掘找出的結(jié)果發(fā)現(xiàn)在2億條打斗記錄中,姓孫的跟姓楊的打,總是姓孫的勝利,孫悟空姓孫,所以,悟空勝利。
用在現(xiàn)實中,我們舉個例子來說,做OLAP分析,我們找找哪些人總是不及時向電信運營商繳錢,一般會分析收入低的人往往會繳費不及時。通過分析,發(fā)現(xiàn)不及時繳錢的窮人占71%。而數(shù)據(jù)挖掘則不同,它自己去分析原因。原因可能是,家住在五環(huán)以外的人,不及時繳錢。這些結(jié)論對推進工作有很深的價值,比如在五環(huán)外作市場調(diào)研,發(fā)現(xiàn)需要建立更多的合作渠道以方便繳費。這是數(shù)據(jù)挖掘的價值。
【分析報告、統(tǒng)計分析和數(shù)據(jù)挖掘的區(qū)別】相關(guān)文章:
數(shù)據(jù)分析報告07-28
數(shù)據(jù)分析報告【推薦】03-07
【推薦】數(shù)據(jù)分析報告03-01
【精】數(shù)據(jù)分析報告03-01
數(shù)據(jù)分析報告15篇08-10
數(shù)據(jù)分析報告(15篇)08-10
數(shù)據(jù)分析報告精選15篇02-17
數(shù)據(jù)分析報告14篇03-02
績效考核數(shù)據(jù)分析報告12-26