面试复盘|网易严选 大数据 一面二面
作者:Richard_$
链接:https://www.nowcoder.com/discuss/720336?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
1h 视频面无手撕
很久没面大厂了有点嘴生,持续八股文输出顶不住
- 自我介绍
2.你熟悉java我们问点问题吧,String的hashcode怎么计算的(不会)、hashcode相同时equals方法起什么作用
3.hashmap 插入key相同时怎么做的,再讲下hashmap的enty结构,每个桶是怎么实现的
4.hashmap、hashtable、contcurrhashmap(提到并发、加锁)
5.java线程几种创建方式,获取返回值是什么(忘了)
6.线程池怎么实现的
7.你对信号量了解吗,乐观锁和悲观锁有什么看法
8.读写锁了解不,要是有一文件一直被读写占用,写锁请求不到怎么办
9.公平、非公平加锁说下?可以用这俩解决上述问题吗,怎么做
10.在线长多线程发生oom时,怎么进行排除,有没有什么好用的工具(无,不知道~)
11.大数据组件熟悉哪些(hadoop、spark)
12.mr、spark对比
13.spark提交任务时有哪些参数可以调整(展开说)
14.spark默认reduce数量是多少
15.spark数据倾斜有遇到过吗,咋处理(八股输出)
16.发生oom解决方案
17.介绍实习生活经历、工作流程,(三个项目经历,详细介绍了其中一个)
18.数据模型怎么建设的(说不清楚)
反问:1.部门业务:我们是三级部门,主要负责数仓建设,其他三级部门也有负责组件开发的
2.数据建模的流程:自底向上和自顶向下,从上往下确定数据的口径、字段,从低向上构建维表进行数据维度的划分
总结:面试官有些问题抓不住到底想问什么,导致回答的不好。一些涉及到生产相关的问题需要再加强下,包括回答的层次结构,要注意分点展开有意引导面试官
二面
1.实习经历介绍就此展开
2.你们数仓有几层,怎么划分的
3.fdm的拉链任务怎么做的
4.维度建模了解吗,有几种
5.维度表有几种构建方式、事实表有几种怎么构建
6.flink sql解析过程
7.flink窗口函数介绍下
8.flink 水位线有什么作用
9.flink spark区别
10.spark stage划分
11.second nn 作用
12.镜像文件名称
总结:一面试官给我挖了坑,让二面重点问我实时,flink没系统学过答得很艰难,数据建模方面的知识还要恶补,希望别凉了。数开岗不同组面试官问的差异很大,偏向数仓的更多的会问数据建模的问题,平开测重java、框架底层