阿里数据分析师校招笔试题参考
1观测宇宙中单位体积内星球的个数,属于什么分布:
A学生分布B泊松分布C正态分布D二项分布
2一些关于数据挖掘说法是正确的
A数据挖掘是万能的
B如果你建立了一个database,那就意味着你已经有足够的数据可以做数据挖掘了
C数据挖掘=数据+算法,数据挖掘人员大部分的时间用来处理复杂的`挖掘算法
DABC均有错
3已知随机变量X,Y分别服从泊松分布P(S),卡方分布X2(t),E(X)=4,D(Y)=9,则参数s,t分别:
A2,9;B4,9C4,4.5;D2,4.5
4下面算法中哪一种不属于广义线性回归算法
A生存模型算法 Bbeta回归算法 Clogit回归算法 D判别分析算法
5有一列1000万淘宝买家的淘宝运费险保费数据,要计算该列数据的P1-P100分位数,可使用哪个SAS语句?
Aproc sort Bproc rank Cproc univariate Dproc freq
6X服从区间(2,6)上的均匀分布,求对X进行3次独立观测中,至少有2次的观测值大于3的概率。
A0.84375 B0.75275 C0.65275 D0.80370
7下面对于“预测变量间可能存在较严重的多重共线性”的论述中错误的是?
A回归系数的符号与专家经验知识不符 B方差膨胀因子(VIF)<5
C其中两个预测变量的相关系数>=0.85 D变量重要性与专家经验严重违背
8由于淘宝买家消费数据是亿级别,假设为了快速计算买家每月的平均消费额,采用抽样1W个买家来计算
A采用分层抽样方法把全量淘宝买家按照星级,每层抽取相同的数量,计算平均值
B采用系统抽样方法,把全量买家随机排序,每隔一定数量抽一个,计算平均值
C采用无放回随机方法,从全量买家中随机挑选一个买家,不放回,如此循环
D采用有放回随机方法,从全量买家中随机挑选一个买家,然后再放回,如此循环
9请找出数列4,9,23,60,157的下一项()
A 411 B 314 C 425 D ABC均错
11以下哪个语法不是R的基础语言
Aproc glot Bselect *from table
Ckc<-kmeans(data,3) Dprint”hello world”
Esd<-summary(data) Fimport
12分析师在工作中的良好习惯是
A将工作空间的密码共享给别人 B将数据下载到私人电脑进行分析处理
C在处理资源高峰期提交大任务运算 D不定期地将分析报告分享给团队
E定期清理存储空间 F固话日常需要分析的数据表方便计算
16请分析淘宝消费者的流失情况
17淘宝和天猫上每天都有大量的用户在线上购买,作为分析师可以从哪些角度对用户进行分析,说明理由
20已知A商家近五年每月的成交数据,请列出两种不同的时间序列预测模型可以用来预测商家接下来三个月的成交,并详细阐述在使用每一种方法前需要对数据进行什么预处理以及具体方法
21你理解中的分析师是什么样的?你觉得自己目前应聘分析师职位的优势是什么?并说明理由。
-
分享中储粮笔试经验
2月12号收到中国储备粮食管理总局的短信通知,2月17号上午在中央财经考试。中国储备粮食管理总局20XX年一共招收8个人,目测笔试的人两三百人多的样子,黑压压的做了一个报告厅。笔试资格不知道是怎么删选的,我是985新闻小硕,同学们基本都投了,但是入围笔试的人不多……...
-
2017年免笔试入学条件表
2017年免笔试入学条件表第一志愿报考本校、符合下列条件之一的考生,可申请免笔试入学。申请免笔试入学的考生须在2017年3月17日9:00—15:30办理免笔试入学申请手续,逾期未提交视作自动放弃处理。我校将组织专家组进行审核,合格的.考生名单将在笔试前由本校阳光招...
-
高露洁公司笔试经过
五一刚从家回来,上博客看到上次还没把高露洁的笔试经过写上去,现在补记上。那天还记着下着毛毛细雨,一早上就给广播吵醒了。路上碰到很多同级的同学,结伴同去。坐了78路车约一个小时到了中山大学,就在找艺术楼,以前我还在艺术楼自修过,竟然不知它在哪,一路上不停问人。...
-
2015年上海农村商业银行业培笔试经验
我在上海开放大学的考场,外面在施工,靠窗坐,不过抗噪音能力还好,就正常地做题了。机房挺热的,很容易口渴,自备一下饮用水比较好。。因为怕时间来不及,默默记了个题型,不过好像每年不一样的。因为是速记的`,2个小时150道题,大概是言语类20题,数学类10题,逻辑类20题,资料分析2...