面试复盘|阿里 大数据 一面
作者:Richard_$
链接:https://www.nowcoder.com/discuss/732950?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
一面 电话 50min
飞猪数据组 偏向平台建设方向
1.自我介绍
2.研究生项目
3.流计算
4.java内存模型
5.垃圾回收
6.什么时候发生fullGC
7.怎么判断是垃圾
8.数据结构了解哪些
9.链表、数组的区别
10.mysql为什么选用B+树
11.能否估计下b+树做索引的整个表的大小
12.mr、spark的shuffle有什么不同
13.宽依赖是什么
14.什么情况下需要划分宽依赖,哪些算子,groupby是行动算子吗
15.mr里join怎么做(说的spark的join)
16.shuffle-join和sort-join使用场景有什么不同
17.一千万个整数,在5mb内存里排序
反问:
1.最后一题不分治怎么解决:用数据压缩计算
2.介绍下部门:飞猪数据组,涉及数仓、数据科学家、平开