面试复盘|网易严选 大数据 一面二面

    作者:Richard_$
    链接:https://www.nowcoder.com/discuss/720336?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    1h 视频面无手撕

    很久没面大厂了有点嘴生,持续八股文输出顶不住

    1. 自我介绍
      2.你熟悉java我们问点问题吧,String的hashcode怎么计算的(不会)、hashcode相同时equals方法起什么作用
      3.hashmap 插入key相同时怎么做的,再讲下hashmap的enty结构,每个桶是怎么实现的
      4.hashmap、hashtable、contcurrhashmap(提到并发、加锁)
      5.java线程几种创建方式,获取返回值是什么(忘了)
      6.线程池怎么实现的
      7.你对信号量了解吗,乐观锁和悲观锁有什么看法
      8.读写锁了解不,要是有一文件一直被读写占用,写锁请求不到怎么办
      9.公平、非公平加锁说下?可以用这俩解决上述问题吗,怎么做
      10.在线长多线程发生oom时,怎么进行排除,有没有什么好用的工具(无,不知道~)
      11.大数据组件熟悉哪些(hadoop、spark)
      12.mr、spark对比
      13.spark提交任务时有哪些参数可以调整(展开说)
      14.spark默认reduce数量是多少
      15.spark数据倾斜有遇到过吗,咋处理(八股输出)
      16.发生oom解决方案
      17.介绍实习生活经历、工作流程,(三个项目经历,详细介绍了其中一个)
      18.数据模型怎么建设的(说不清楚)

    反问:1.部门业务:我们是三级部门,主要负责数仓建设,其他三级部门也有负责组件开发的
    2.数据建模的流程:自底向上和自顶向下,从上往下确定数据的口径、字段,从低向上构建维表进行数据维度的划分
    总结:面试官有些问题抓不住到底想问什么,导致回答的不好。一些涉及到生产相关的问题需要再加强下,包括回答的层次结构,要注意分点展开有意引导面试官

    二面
    1.实习经历介绍就此展开
    2.你们数仓有几层,怎么划分的
    3.fdm的拉链任务怎么做的
    4.维度建模了解吗,有几种
    5.维度表有几种构建方式、事实表有几种怎么构建
    6.flink sql解析过程
    7.flink窗口函数介绍下
    8.flink 水位线有什么作用
    9.flink spark区别
    10.spark stage划分
    11.second nn 作用
    12.镜像文件名称

    总结:一面试官给我挖了坑,让二面重点问我实时,flink没系统学过答得很艰难,数据建模方面的知识还要恶补,希望别凉了。数开岗不同组面试官问的差异很大,偏向数仓的更多的会问数据建模的问题,平开测重java、框架底层