阿里集团CTO线 数据研发 实习 一面凉经
作者:猫科动物水狐狸
链接:https://www.nowcoder.com/discuss/637383?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
我有毛病(自我感叹),我其实不会数据,但内推的时候我没仔细看岗位直接点点点一路点了下去hhhh
然后就面了数据科学家实习生,和我不是很对口,就有点点尴尬
HR和我说一面主要围绕项目经历,统计学原理,数据挖掘技术,数据仓库展开
一面是电话面试,但因为要写代码,所以手边要有一台连得上网的电脑
先是5-10分钟自我介绍,面试官仔细问了我之前在微软STCA的经历,问了下使用的算法和数据分类时选取的特征,最后实现的结果等等。
以及问了下过拟合是怎么判断的这样这样
接着是问了两道智力题:
问题1. 在一个与世隔绝的村子中,有50户人家,每户人家有一匹马,在这50匹马中有病马(病不传染)。于是人们要找出生病的马,每户人可以观察其他的49匹马,并能够判断他们是否生病,只有自己家的马不能看,观察后得出的结果也不能交流,不能通知马的主人。主人一旦推算出自己家的马是病马,当天就要开枪打死它,而且每个人只有权力枪毙自己的马,没有权力枪毙别人的马。第一天、第二天都没有枪响,到了第三天传来一阵*,问有几匹病马,如何推算得出?
问题2. 假如草地上有一群兔子,数量无穷多,但是体重不相同。我们从中选出10只兔子,记其中的最重的兔子的重量为A, 然后再从剩余的兔子中选出20只,记其中的最重的兔子的重量为B, 问A大于B的概率是多少?
这两道都答出来的。
然后问我会不会写SQL,我:不会,只会写微软的scope
面试官:噢,那这个还要再加强加强
我(内心):不是R,python,SQL中有会的就行了么呜呜呜呜另外另个我会啊
再接着是问了几个统计学基础知识:
解释下什么是假设检验,什么是显著性水平,检验统计量和P值
给出一个实际问题,要怎么进行假设检验(给了一道题)
假设检验的两种错误是什么?怎么减少第二类错误,为什么这个方法可以减少第二类错误?
其实问题我都答出来了,而且面试官说是对的,然后我被挂了,我觉得是我不会写SQL的缘故hhhhh