美团校招数据开发面经
作者:牛客397668003号
链接:https://www.nowcoder.com/discuss/628767?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
一面:
先问了项目
- hadoop的读写流程,副本机制,为什么三副本,三副本怎么放(副本放置策略)
- hdfs容错机制(secondarynamenode)
- spark容错机制
- spark的stage是怎么划分的
- spark的部署、调度原理(master、worker这些)
- 数据倾斜怎么处理
- 实时处理的了解吗(我说flink),反压了解吗。
- 两个窗口一个数据正常均匀,一个数据不平衡(比如前面数据特别多后面特别少),怎么处理(意思应该是有可能时间划分出错,调整一下窗口的起始位置和结束位置)
- 算法题,链表判断是否有环、二叉树的深度
- mysql索引什么时候无作用,或者说什么情况不适合建索引
- 反问
二面:
问了项目还有工作经历(虽然不相关),不断往下问,主要看思路,可能考察工作实习有没有多思考
- SQL题,两个表,表order是city,amount,表location是city, province,得出省份总交易额在[0,600],[400,1100],[1000,+infinite] 这三个区间的省份的数量
- 算法题,字符串’AxxxxxBxxxxCxxxDxxx’(相当于log),A后面的信息是对应A这个key的value,B后面对应B的以此类推,将字符串它转成可读的信息
- 上述题目,除了这种字符串保存的log,还能想出怎样的保存方式(有了解过json、正则?)
- 为什么用字符串不用json,优点是什么
- 反问