範文齋

位置:首頁 > 職場範文 > 筆試

阿里數據分析師校招筆試題參考

筆試2.38W

1觀測宇宙中單位體積內星球的個數,屬於什麼分佈:

阿里數據分析師校招筆試題參考

A學生分佈B泊松分佈C正態分佈D二項分佈

2一些關於數據挖掘說法是正確的

A數據挖掘是萬能的

B如果你建立了一個database,那就意味着你已經有足夠的數據可以做數據挖掘了

C數據挖掘=數據+算法,數據挖掘人員大部分的時間用來處理複雜的`挖掘算法

DABC均有錯

3已知隨機變量X,Y分別服從泊松分佈P(S),卡方分佈X2(t),E(X)=4,D(Y)=9,則參數s,t分別:

A2,9;B4,9C4,4.5;D2,4.5

4下面算法中哪一種不屬於廣義線性迴歸算法

A生存模型算法 Bbeta迴歸算法 Clogit迴歸算法 D判別分析算法

5有一列1000萬淘寶買家的淘寶運費險保費數據,要計算該列數據的P1-P100分位數,可使用哪個SAS語句?

Aproc sort Bproc rank Cproc univariate Dproc freq

6X服從區間(2,6)上的均勻分佈,求對X進行3次獨立觀測中,至少有2次的觀測值大於3的概率。

A0.84375 B0.75275 C0.65275 D0.80370

7下面對於“預測變量間可能存在較嚴重的多重共線性”的論述中錯誤的是?

A迴歸係數的符號與專家經驗知識不符 B方差膨脹因子(VIF)<5

C其中兩個預測變量的相關係數>=0.85 D變量重要性與專家經驗嚴重違背

8由於淘寶買家消費數據是億級別,假設爲了快速計算買家每月的平均消費額,採用抽樣1W個買家來計算

A採用分層抽樣方法把全量淘寶買家按照星級,每層抽取相同的數量,計算平均值

B採用系統抽樣方法,把全量買家隨機排序,每隔一定數量抽一個,計算平均值

C採用無放回隨機方法,從全量買家中隨機挑選一個買家,不放回,如此循環

D採用有放回隨機方法,從全量買家中隨機挑選一個買家,然後再放回,如此循環

9請找出數列4,9,23,60,157的下一項()

A 411 B 314 C 425 D ABC均錯

11以下哪個語法不是R的基礎語言

Aproc glot Bselect *from table

Ckc<-kmeans(data,3) Dprint”hello world”

Esd<-summary(data) Fimport

12分析師在工作中的良好習慣是

A將工作空間的密碼共享給別人 B將數據下載到私人電腦進行分析處理

C在處理資源高峯期提交大任務運算 D不定期地將分析報告分享給團隊

E定期清理存儲空間 F固話日常需要分析的數據表方便計算

16請分析淘寶消費者的流失情況

17淘寶和天貓上每天都有大量的用戶在線上購買,作爲分析師可以從哪些角度對用戶進行分析,說明理由

20已知A商家近五年每月的成交數據,請列出兩種不同的時間序列預測模型可以用來預測商家接下來三個月的成交,並詳細闡述在使用每一種方法前需要對數據進行什麼預處理以及具體方法

21你理解中的分析師是什麼樣的?你覺得自己目前應聘分析師職位的優勢是什麼?並說明理由。