面试复盘|阿里 大数据 一面

    作者:Richard_$
    链接:https://www.nowcoder.com/discuss/732950?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    一面 电话 50min
    飞猪数据组 偏向平台建设方向
    1.自我介绍
    2.研究生项目
    3.流计算
    4.java内存模型
    5.垃圾回收
    6.什么时候发生fullGC
    7.怎么判断是垃圾
    8.数据结构了解哪些
    9.链表、数组的区别
    10.mysql为什么选用B+树
    11.能否估计下b+树做索引的整个表的大小
    12.mr、spark的shuffle有什么不同
    13.宽依赖是什么
    14.什么情况下需要划分宽依赖,哪些算子,groupby是行动算子吗
    15.mr里join怎么做(说的spark的join)
    16.shuffle-join和sort-join使用场景有什么不同
    17.一千万个整数,在5mb内存里排序
    反问:
    1.最后一题不分治怎么解决:用数据压缩计算
    2.介绍下部门:飞猪数据组,涉及数仓、数据科学家、平开