範文齋

位置:首頁 > 職場範文 > 面試

百度數據分析員面試測試題

面試1.83W

大概一個月前,筆者接到百度的面試電話,去應試數據分析員的工作。儘管無意去工作,但是還是希望能看看他們的測試題到底是怎麼樣的。於是接觸到了一下的題目:

百度數據分析員面試測試題

總共十個題目(當然全是excel函數題):

1、根據員工的身份證號,統計員工的生日。衆所周知,我國居民身份證號有18位和15位數之分。對於同樣位數的身份證號統計想必不是很難,但是混雜了兩種情況的統計怎麼來做呢?

背景材料:

15位的身份證號碼:450104771010156

(1)1~6位爲地區代碼

(2)7~8位爲出生年份(2位),9~10位爲出生月份,11~12位爲出生日期

(3)第13~15位爲順序號,並能夠判斷性別,奇數爲男,偶數爲女。

18位的身份證號碼:450104197710101516

(1)1~6位爲地區代碼,

(2)7~10位爲出生年份(4位),如1977

(3)11~12位爲出生月份,如10

(4)13~14位爲出生日期,如10

(5)第15~17位爲順序號

2、從備註材料中抽提其中的物料代碼,代碼的格式是“0000-00000”,備註是文字和數字的混合。如“某某客戶投訴0000-00000產品有質量問題,香氣偏淡”。讓你寫出函數從中提取出物料代碼。

3、AB列各有N多個單字節文本,但其中個別單元格有空白。要求:B3單元格有文字就顯示B3單元格,若B3無文字而A3有,則顯示A3單元格文字,如果A3也沒有文字,則顯示“濟南”。

4.有個物料庫存區域,有諸多原料進倉數據,單個原料有多次進倉記錄的,讓統計部分原料的庫存總數量。

5、考勤情況統計。A代表上班,K曠工,S遲到,B病假,W出差

按照日期記錄每個員工的考勤情況。月底對員工考勤情況進行統計。

6、小數點的取捨。保留小數點後兩位,和截留取整。

7、有一副用數字0填充單元格組成的圖畫,讓改變該副圖畫的背景顏色。

還有三個題時隔久遠,一時想不起了,抱歉,只能發這幾個題了。

知道答案的可以在隨後的評論中寫出,猜不出的可以問我。

--

--以下爲本人收集的幾種數據分析工具--

T

QUEST是IBM公司Almaden研究中心開發的一個多任務數據挖掘系統,目的是爲新一代決策支持系統的應用開發提供高效的數據開採基本構件。系統具有如下特點:

提供了專門在大型數據庫上進行各種開採的功能:關聯規則發現、序列模式發現、時間序列聚類、決策樹分類、遞增式主動開採等。

各種開採算法具有近似線性(O(n))計算複雜度,可適用於任意大小的數據庫。

算法具有找全性,即能將所有滿足指定類型的模式全部尋找出來。

爲各種發現功能設計了相應的並行算法。

Set

MineSet是由SGI公司和美國Standford大學聯合開發的多任務數據挖掘系統。MineSet集成多種數據挖掘算法和可視化工具,幫助用戶直觀地、實時地發掘、理解大量數據背後的知識。MineSet有如下特點:

MineSet以先進的可視化顯示方法聞名於世。

提供多種 萃誥蚰J健0 ǚ擲嗥鰲⒒毓檳J健⒐亓 嬖頡⒕劾喙欏⑴卸狹兄匾 取?br>

支持多種關係數據庫。可以直接從Oracle、Informix、Sybase的表讀取數據,也可以通過SQL命令執行查詢。

多種數據轉換功能。在進行挖掘前,MineSet可以去除不必要的數據項,統計、集合、分組數據,轉換數據類型,構造表達式由已有數據項生成新的數據項,對數據採樣等。

操作簡單、支持國際字符、可以直接發佈到Web。

ner

DBMiner是加拿大SimonFraser大學開發的一個多任務數據挖掘系統,它的前身是DBLearn。該系統設計的目的是把關係數據庫和數據開採集成在一起,以面向屬性的.多級概念爲基礎發現各種知識。DBMiner系統具有如下特色:

能完成多種知識的發現:泛化規則、特性規則、關聯規則、分類規則、演化知識、偏離知識等。

綜合了多種數據開採技術:面向屬性的歸納、統計分析、逐級深化發現多級規則、元規則引導發現等方法。

提出了一種交互式的類SQL語言數據開採查詢語言DMQL。

能與關係數據庫平滑集成。

實現了基於客戶/服務器體系結構的Unix和pC(Windows/NT)版本的系統。

L MATLAB Origin 等等

當前流行的圖形可視化和數據分析軟件有Matlab,Mathmatica和Maple等。這些軟件功能強大,可滿足科技工作中的許多需要,但使用這些軟件需要一定的計算機編程知識和矩陣知識,並熟悉其中大量的函數和命令。而使用Origin就像使用Excel和Word那樣簡單,只需點擊鼠標,選擇菜單命令就可以完成大部分工作,獲得滿意的結果。 但它又比excel要強大些。一般日常的話可以用Excel,然後加載宏,裏面有一些分析工具,不過有時需要數據庫軟件支持。