陌陌一面+二面+HR面(数据平台开发)

    作者:201910111848433
    链接:https://www.nowcoder.com/discuss/691673?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    7.26 时长一小时
    1.自我介绍

    2.详细介绍下京东实习经历

    3.spark整个执行流程

    4.为什么要划分stage

    5.广播变量是什么,底层怎么实现的

    6.spark小文件问题,有没有遇到过oom

    7.flume使用的是什么 channel,如何去保证可靠性
    8.kafka如何保证高吞吐量,会不会出现丢数据
    9.什么是零拷贝,什么是顺序读写,为什么比随机读写快
    10. hdfs的写流程,如果写的过程中一个节点挂了怎么办
    11.hashmap hashtable对比

    12.hashmap put过程(这几个老八股真记不清了)

    13.hashmap怎么变成线程安全

    14.什么是虚拟内存,如何根据虚拟内存查找内存地址。用户态内核态是什么,为什么要进行划分

    15.TCP/IP模型解释,tcp,udp区别
    18.算法题 已经知道rand 返回1-max 求rand(m,n) 这题没写出来,后来网上也没找到答案

    19.第二题 10G数据20M内存,怎么排序。口述即可

    7.27 一小时
    1.自我介绍

    2.sql的底层逻辑,CBO和RBO的优化

    3.如何监控系统的性能,状态。
    4.cap理论
    5.都是基于实习项目问的,没有写代码。

    7.27 HR面
    1.自我介绍
    2.实习为什么离职
    3.三个优点,三个缺点
    4.如果和同事发生争执,怎么解决
    5.目前投了多少公司,薪资要求。

    HR说后续还有一轮技术面试