- 相關推薦
數(shù)據(jù)分析師都干啥?
數(shù)據(jù)分析師,簡單切詞為“數(shù)據(jù)”,“分析”,“師”。因此,獲取必要的數(shù)據(jù),分析這些數(shù)據(jù),然后從數(shù)據(jù)中發(fā)現(xiàn)一些問題提出自己的想法,這就是一個數(shù)據(jù)分析師的基本工作內(nèi)容。
自己做了兩年數(shù)據(jù)分析師,真的覺得古語說的對,“功夫在詩外”。一名好的數(shù)據(jù)分析師,接到一個需求時,會更多考慮這個需求本身,包括要做的東西是什么,為什么這么做,還可以怎么做,怎么去做,關鍵點是什么。都想清楚了,才去動手做。建議任何一名數(shù)據(jù)分析人員,都能在做以前把問題想清楚,確認清楚,不要等到做完才發(fā)現(xiàn)自己做錯了,那樣會很浪費時間。自己這方面曾犯過N多錯誤。
下面簡單談下做一名數(shù)據(jù)分析師要經(jīng)歷的幾個步驟:
(1)獲取數(shù)據(jù)
獲取相關的數(shù)據(jù),是數(shù)據(jù)分析的前提。每個企業(yè),都有自己的一套存儲機制。比如淘寶,所有的數(shù)據(jù)都在HADOOP上,很多數(shù)據(jù)都要經(jīng)過HADOOP,hive來獲取。因此,基礎的SQL語言是必須的。具備基本SQL基礎,再學習下HIVE的細節(jié)的語法,基本就可以通過HIVE拿到很多數(shù)據(jù)了。每個需求明確以后,都要根據(jù)需要,把相關的數(shù)據(jù)獲取到,做基礎數(shù)據(jù)。
(2)數(shù)據(jù)處理
獲取數(shù)據(jù),把數(shù)據(jù)處理成自己想要的東西,是一個關鍵點。很多時候,有了數(shù)據(jù)不是完成,而是分析的開始。數(shù)據(jù)分析師最重要的工作就是把數(shù)據(jù)根據(jù)需求處理好,只有數(shù)據(jù)跟需求結合起來,才能發(fā)揮數(shù)據(jù)的價值,看到需求的問題和本質所在。如果連數(shù)據(jù)都沒處理好,何談從數(shù)據(jù)中發(fā)現(xiàn)問題呢?
對于數(shù)據(jù)的處理,有兩種形式:
a>如果初步提取的數(shù)據(jù)是在LINUX上,建議學一門腳本語言,比如AWK,或者PYTHON。如果掌握一門腳本語言,不僅可以在LINUX系統(tǒng)上寫很多自動腳本來運行,會大大節(jié)省自己的時間,而且可以通過腳本語言把基礎數(shù)據(jù)處理成自己想要的任何形式,直接可以使用。
b>如果數(shù)據(jù)沒有在LINUX上,那可以download,然后通過其他統(tǒng)計軟件來處理。個人推薦SAS或者R語言。SAS的強大,不必多說。沒有SAS解決不了的問題,而且SAS也有SQL,處理起來也方便。R語言最近也很火,而且免費,packages越來越多,畫圖也簡單,類似Matlab。如果前期數(shù)據(jù)處理的好,后續(xù)只需要通過R或者SAS畫一些圖就可以了。在數(shù)據(jù)分析師的世界,按照價值排序,圖>表>文字。
(3)分析數(shù)據(jù)
這里的數(shù)據(jù),包括圖,表,數(shù)字幾種。分析數(shù)據(jù)是整個分析的關鍵,也考驗分析師的水平。好的分析師,可以根據(jù)趨勢圖,對比數(shù)據(jù),敏銳的觀察到很多問題。可是這需要對業(yè)務,對數(shù)據(jù)有很深的了解,才會把數(shù)據(jù)和業(yè)務結合起來,發(fā)揮兩者的價值,完成需求。所以,一名數(shù)據(jù)分析師,要把更多的時間放在了解業(yè)務上。只有業(yè)務了解,細節(jié)清楚,才會明白業(yè)務變動可能引起的數(shù)據(jù)指標的變動,也會在后續(xù)的需求分析中,更快更全面的解決其他人提出的問題?赡芎芏嗳硕己芾Щ螅趺床拍堋懊翡J”的觀察到數(shù)據(jù)的變動呢,我為什么怎么也發(fā)現(xiàn)不了問題呢?個人感覺可以通過以下方法,來慢慢鍛煉:
a>多問幾個為什么。比如,看到一些指標,就想想這些指標代表什么,用自己的話可以怎么理解;看到一條趨勢線有波動,就想想為啥子某個點異常波動呢?多問問問題,自己就會加深對業(yè)務和指標關聯(lián)的敏感性。
b>借鑒統(tǒng)計方法。統(tǒng)計學中,都會有一些橫縱對比,趨勢分析等等。對比,在分析師數(shù)據(jù)時候,是一個很重要的東西。任何東西,也因為了對比,才會有高有低,有長有短。另外,分布,也是一個很好的東西。分布的變化,就意味著變動,變動的發(fā)展結果,就能知道業(yè)務發(fā)展的好壞。再次,占比啊等等,都是很簡單但是實用的方法。
c>向師兄請教。有的時候,一個問題,自己沉迷其中不能自拔,旁觀者一句話,就能點清自己的思路。當自己分析數(shù)據(jù)不得要領的時候,就多請教師兄。
(4)展示成果
分析數(shù)據(jù)以后,解決需求的問題,就需要匯總分析的成果,給到其他人?赡芊治龅倪^程,拿到的數(shù)據(jù)有很多,需要全部給其他人么?怎么去羅列這些數(shù)據(jù)呢?可能很多人都犯難。有一次,一個同學來問我,她有很多數(shù)據(jù),但是就是不知道該怎么組織,才能證明自己的結論是對的。其實,作為一名數(shù)據(jù)分析師,就是根據(jù)數(shù)據(jù),把問題解決,提出一兩條參考建議給到需求方就OK了。因此,回復的結果簡單明了就好。如果是回復一封郵件,可以這樣來做:
a>郵件正文,先寫主要結論,即根據(jù)數(shù)據(jù)和需求,有什么結論。這樣大家第一眼就能抓到最關鍵的東西,可能不需要看那些詳細的數(shù)據(jù);
b>如果覺得有必要,就在下面再把分析過程寫進去;
c>如果圖和圖表不多,可以添加到郵件第三部分。畢竟放上數(shù)據(jù),任何同學有疑問,可以隨時去看數(shù)據(jù)。如果圖和圖表實在太多,就放到附件!
其實,做一名數(shù)據(jù)分析師,真的不容易,不僅要懂業(yè)務,還要會技術,更要敏銳發(fā)現(xiàn)問題,總結,還要提出建議。自己干了N多工作,最后還不一定能得到一個好的結果。做了兩年數(shù)據(jù)分析師,自己的重心也在慢慢的轉移。從剛開始技術學習,到后面技術+業(yè)務的結合,到現(xiàn)在自己又鉆到業(yè)務,研究業(yè)務,慢慢發(fā)現(xiàn):一名好的數(shù)據(jù)分析師,是一個好的產(chǎn)品的規(guī)劃者和行業(yè)的領跑者。
【數(shù)據(jù)分析師都干啥?】相關文章:
數(shù)據(jù)分析師的職責02-07
數(shù)據(jù)分析師工作職責05-27
數(shù)據(jù)分析師的崗位職責11-03
數(shù)據(jù)分析師崗位職責07-01
數(shù)據(jù)分析師的職責15篇02-07
數(shù)據(jù)分析師個人簡歷03-03