作者:DStream
    链接:https://www.nowcoder.com/discuss/265416?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    1.自我介绍
    2.hadoop角色(刚问到这个问题一个公司的面试电话打来,为了接电话还让面试官等了我一会。。。) hdfs高可用 hdfs写流程
    3.项目
    4.spark shuffle和mr shuffle的区别
    5.tcp ip协议,三次握手
    6.设计一个结构存key value
    7.hashmap数据结构,你怎么实现线程安全
    8.应用题 两个50亿行的记录url的文件,2g内存,找出相同的url

    大概就是这些。。。可能有些遗漏