範文齋

位置:首頁 > 職場範文 > 筆試

阿里巴巴往年的針對招聘數據分析實習生崗位的筆試題完整版

筆試7.73K

有幸參加阿里數據分析實習生的筆試題。在羣裏發現好多人的題目多不一樣,應該是從題庫隨機發放的。

阿里巴巴往年的針對招聘數據分析實習生崗位的筆試題完整版

總共15題,客觀題和主觀題兩部分,答題時間60min

1、以下算法對缺失值敏感的模型包括:

A、Logistic Regression

B、隨機森林

C、樸素貝葉斯

D、C4.5

2、找出數列2,5,13,34,89,…的下一項:

A、233

B、144

C、267

D、ABC均錯誤

3、某人賣掉了兩張面值爲30元的電話卡,均是30元價格成交的,其中一張賺了20%,其中一張賠了20%。問他總體是盈利還是虧損,贏/虧多少?

A、不盈不虧

B、盈利2.5元

C、虧損2.5元

D、盈利2元

4、以下場景中,對應使用的挖掘算法不合適的是:

A、用關聯規則算法分析購買了羽毛球的買家,是否適合推薦羽毛球鞋

B、根據用戶最近幾年的消費金額數據,用主成分分析法你何處用戶未來一個月可能的消費金額公式

C、根據用戶最近一年的購物日誌數據,用K-means算法聚類出淘寶賣家中的'高富帥和白富美

D、根據用戶最近購買的商品信息,用決策數算法識別出淘寶買家可能是男是女

5、投擲均勻正六面體骰子的熵是:

A、1bit

B、2.6bit

C、3.2bit

D、3.6bit

6、某調查公司接受委託滿意度調查,滿意分數在0~20之間,隨機抽取36名消費者,平均滿意分12,標準差3,在大樣本的假設下,根據調查結果對總體平均的置信區間,結果是:

A、9~15分

B、11~13分

C、12~14分

D、6~18分

7、市場部選擇部分用戶來進行產品A的短信推廣,獲取了用戶在時間窗口內是否購買了A產品的數據。數據挖掘同學通過這些已知的是否購買數據,用來判斷其他用戶的購買傾向,這在數據挖掘中屬於什麼任務?

A、聚類

B、預測

C、探索性分析

D、關聯規則

8、如何將一個EXCEL文件單元格C2中的手機號13501245678的第四位至第七位隱藏爲*

A、=replace(C2,4,4,**)

B、=replace(C2,4,4,”**“)

C、=replace(C2,4,7,”**“)

D、=replace(C2,4,7,**)

9、邏輯迴歸中迴歸參數可以用以下哪些方法求解?

A、最小二乘法

B、牛頓迭代法

C、蒙特卡洛法

D、似然估計法

10、微軟的EXCEL軟件是強大的數據分析工具,以入門簡單、擴展功能強大、可視化豐富著稱,其中EXCEL圖表是數據分析師最常用的用於展現分析結果的工具,EXCEL圖表選擇描述正確的有:

A、折線圖用來展現數據隨着時間推移而發生變化,並可以預測未來的發展趨勢

B、散點圖用來說明同一類別的數個事物中各項的組成比重,或者某一事物隨着時間推移其各個組成的比重變化

C、餅圖主要用來分析內部各個組成部分的佔總體的比重,反映對總體的影響

D、雷達圖主要是對同類別的二組事物在多種項目上的對比

11、請說明隨機森林較一般決策樹穩定的幾點原因。

12、考察SQL語句:

有一張交易表A(trade_no爲主鍵),一張交易異常表B(trade_no爲主鍵),

1)、計算交易表A中的交易總數;

2)、通過關聯表的方式實現A表中去除B表異常交易(保留A中的字段即可)

13、某業務部門在上週結束了爲期一週的大促,作爲業務對口分析師,需要你對活動進行一次評估,你會從哪幾方面進行分析。

14、世界上每十萬人中就有一人是艾滋病患者。某一種藥物可以幫助檢測艾滋病,如果一人真是艾滋病,可以百分百檢測出來,而如果一個人沒有艾滋病,它的檢測出錯的概率是1%。請問利用這種檢測藥物,監測正確的概率有多高?

15、閱卷官明天要去爬山,希望正在答卷的你幫他準備個包,裏面放一些必須的物品,請詳述一下你會如何處理。