作者:Richard_$
链接:https://www.nowcoder.com/discuss/743737?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
排序又挂了来面二志愿
一面 45min
1.自我介绍,挑个项目说下
2.围绕 这个项目介绍了老半天哪里都是问题
3.使用的算法userCF itemCF?混合协同、内容推荐
4.离线推荐算了什么东西,实时推荐引入的用户、电影特征加入离线计算吗
5.实时的特征怎么完成计算的,数据是基于离线来算的你这个应该是离线推荐+实时特征写入
6.hive 和 spark sql的区别
7.hive 和 spark sql、spark on hive的区别
8.mysql的索引
9.想做运维还是数开
算法:合并k个升序列表
隔天约二面
二面 45min
1.自我介绍
2.详细介绍下实习所做的项目(所有项目,挑重点讲,从业务背景、担任职责、数仓建设、数据处理流程)
3.怎么确定明细层需要有哪些字段
4.数据仓库的分层
5.flinksql怎么写的
6.select col1 ,col2 from table group by col1 在mr里如何执行的,map端key是哪一个
7.实时展示的数据质量如何保证
8.使用过linux吗,怎么在linux上查看mysql的端口号,要是想修改怎么做,如何查看linux的负载均衡情况
9.实习的过程中遇到的一个难题或者感悟
算法:输出最小的k个数字
面试到了后期八股真没什么可以聊的,有生产项目的基本都是深挖,实习的时候多去了解下产品需求的背景定位,技术的选型、架构多问问同事。项目里每一步的数据流程动转化弄清楚为什么这么做,中间有什么问题能够和高级八股文结合上的,项目里的难点在哪,没有就给自己创造一个并且提出自己的优化手段,从业务逻辑、代码层面、底层实现去思考