- 相關(guān)推薦
百度數(shù)據(jù)分析員面試測(cè)試題
大概一個(gè)月前,筆者接到百度的面試電話,去應(yīng)試數(shù)據(jù)分析員的工作。盡管無(wú)意去工作,但是還是希望能看看他們的測(cè)試題到底是怎么樣的。于是接觸到了一下的題目:
總共十個(gè)題目(當(dāng)然全是excel函數(shù)題):
1、根據(jù)員工的身份證號(hào),統(tǒng)計(jì)員工的生日。眾所周知,我國(guó)居民身份證號(hào)有18位和15位數(shù)之分。對(duì)于同樣位數(shù)的身份證號(hào)統(tǒng)計(jì)想必不是很難,但是混雜了兩種情況的統(tǒng)計(jì)怎么來(lái)做呢?
背景材料:
15位的身份證號(hào)碼:450104771010156
(1)1~6位為地區(qū)代碼
(2)7~8位為出生年份(2位),9~10位為出生月份,11~12位為出生日期
(3)第13~15位為順序號(hào),并能夠判斷性別,奇數(shù)為男,偶數(shù)為女。
18位的身份證號(hào)碼:450104197710101516
(1)1~6位為地區(qū)代碼,
(2)7~10位為出生年份(4位),如1977
(3)11~12位為出生月份,如10
(4)13~14位為出生日期,如10
(5)第15~17位為順序號(hào)
2、從備注材料中抽提其中的物料代碼,代碼的格式是“0000-00000”,備注是文字和數(shù)字的混合。如“某某客戶投訴0000-00000產(chǎn)品有質(zhì)量問(wèn)題,香氣偏淡”。讓你寫出函數(shù)從中提取出物料代碼。
3、AB列各有N多個(gè)單字節(jié)文本,但其中個(gè)別單元格有空白。要求:B3單元格有文字就顯示B3單元格,若B3無(wú)文字而A3有,則顯示A3單元格文字,如果A3也沒(méi)有文字,則顯示“濟(jì)南”。
4.有個(gè)物料庫(kù)存區(qū)域,有諸多原料進(jìn)倉(cāng)數(shù)據(jù),單個(gè)原料有多次進(jìn)倉(cāng)記錄的,讓統(tǒng)計(jì)部分原料的庫(kù)存總數(shù)量。
5、考勤情況統(tǒng)計(jì)。A代表上班,K曠工,S遲到,B病假,W出差
按照日期記錄每個(gè)員工的考勤情況。月底對(duì)員工考勤情況進(jìn)行統(tǒng)計(jì)。
6、小數(shù)點(diǎn)的取舍。保留小數(shù)點(diǎn)后兩位,和截留取整。
7、有一副用數(shù)字0填充單元格組成的圖畫,讓改變?cè)摳眻D畫的背景顏色。
還有三個(gè)題時(shí)隔久遠(yuǎn),一時(shí)想不起了,抱歉,只能發(fā)這幾個(gè)題了。
知道答案的可以在隨后的評(píng)論中寫出,猜不出的可以問(wèn)我。
--
--以下為本人收集的幾種數(shù)據(jù)分析工具--
1.QUEST
QUEST是IBM公司Almaden研究中心開(kāi)發(fā)的一個(gè)多任務(wù)數(shù)據(jù)挖掘系統(tǒng),目的是為新一代決策支持系統(tǒng)的應(yīng)用開(kāi)發(fā)提供高效的數(shù)據(jù)開(kāi)采基本構(gòu)件。系統(tǒng)具有如下特點(diǎn):
提供了專門在大型數(shù)據(jù)庫(kù)上進(jìn)行各種開(kāi)采的功能:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、時(shí)間序列聚類、決策樹分類、遞增式主動(dòng)開(kāi)采等。
各種開(kāi)采算法具有近似線性(O(n))計(jì)算復(fù)雜度,可適用于任意大小的數(shù)據(jù)庫(kù)。
算法具有找全性,即能將所有滿足指定類型的模式全部尋找出來(lái)。
為各種發(fā)現(xiàn)功能設(shè)計(jì)了相應(yīng)的并行算法。
2.MineSet
MineSet是由SGI公司和美國(guó)Standford大學(xué)聯(lián)合開(kāi)發(fā)的多任務(wù)數(shù)據(jù)挖掘系統(tǒng)。MineSet集成多種數(shù)據(jù)挖掘算法和可視化工具,幫助用戶直觀地、實(shí)時(shí)地發(fā)掘、理解大量數(shù)據(jù)背后的知識(shí)。MineSet有如下特點(diǎn):
MineSet以先進(jìn)的可視化顯示方法聞名于世。
提供多種 萃誥蚰J健0 ǚ擲嗥鰲⒒毓檳J健⒐亓 嬖頡⒕劾喙欏⑴卸狹兄匾 取?br>
支持多種關(guān)系數(shù)據(jù)庫(kù)?梢灾苯訌腛racle、Informix、Sybase的表讀取數(shù)據(jù),也可以通過(guò)SQL命令執(zhí)行查詢。
多種數(shù)據(jù)轉(zhuǎn)換功能。在進(jìn)行挖掘前,MineSet可以去除不必要的數(shù)據(jù)項(xiàng),統(tǒng)計(jì)、集合、分組數(shù)據(jù),轉(zhuǎn)換數(shù)據(jù)類型,構(gòu)造表達(dá)式由已有數(shù)據(jù)項(xiàng)生成新的數(shù)據(jù)項(xiàng),對(duì)數(shù)據(jù)采樣等。
操作簡(jiǎn)單、支持國(guó)際字符、可以直接發(fā)布到Web。
3.DBMiner
DBMiner是加拿大SimonFraser大學(xué)開(kāi)發(fā)的一個(gè)多任務(wù)數(shù)據(jù)挖掘系統(tǒng),它的前身是DBLearn。該系統(tǒng)設(shè)計(jì)的目的是把關(guān)系數(shù)據(jù)庫(kù)和數(shù)據(jù)開(kāi)采集成在一起,以面向?qū)傩缘亩嗉?jí)概念為基礎(chǔ)發(fā)現(xiàn)各種知識(shí)。DBMiner系統(tǒng)具有如下特色:
能完成多種知識(shí)的發(fā)現(xiàn):泛化規(guī)則、特性規(guī)則、關(guān)聯(lián)規(guī)則、分類規(guī)則、演化知識(shí)、偏離知識(shí)等。
綜合了多種數(shù)據(jù)開(kāi)采技術(shù):面向?qū)傩缘臍w納、統(tǒng)計(jì)分析、逐級(jí)深化發(fā)現(xiàn)多級(jí)規(guī)則、元規(guī)則引導(dǎo)發(fā)現(xiàn)等方法。
提出了一種交互式的類SQL語(yǔ)言數(shù)據(jù)開(kāi)采查詢語(yǔ)言DMQL。
能與關(guān)系數(shù)據(jù)庫(kù)平滑集成。
實(shí)現(xiàn)了基于客戶/服務(wù)器體系結(jié)構(gòu)的Unix和pC(Windows/NT)版本的系統(tǒng)。
4.EXCEL MATLAB Origin 等等
當(dāng)前流行的圖形可視化和數(shù)據(jù)分析軟件有Matlab,Mathmatica和Maple等。這些軟件功能強(qiáng)大,可滿足科技工作中的許多需要,但使用這些軟件需要一定的計(jì)算機(jī)編程知識(shí)和矩陣知識(shí),并熟悉其中大量的函數(shù)和命令。而使用Origin就像使用Excel和Word那樣簡(jiǎn)單,只需點(diǎn)擊鼠標(biāo),選擇菜單命令就可以完成大部分工作,獲得滿意的結(jié)果。 但它又比excel要強(qiáng)大些。一般日常的話可以用Excel,然后加載宏,里面有一些分析工具,不過(guò)有時(shí)需要數(shù)據(jù)庫(kù)軟件支持。
【百度數(shù)據(jù)分析員面試測(cè)試題】相關(guān)文章:
數(shù)據(jù)分析員崗位職責(zé)說(shuō)明07-10
數(shù)據(jù)分析員工作總結(jié)2篇02-02
數(shù)據(jù)分析員工作總結(jié)4篇01-26
數(shù)據(jù)分析員工作總結(jié)(3篇)02-23