好未来数仓实习一面、二面
作者:kuber
链接:https://www.nowcoder.com/discuss/661892?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
5.8投的,5.12被捞上来了,约5.13下午3点一面
一面,1h
一个小姐姐(我印象中只有hr会遇到小姐姐hhhh)
1.自我介绍
2.之前实习的一些问题
3.看你之前实习用hive比较多,那你了解hive的架构吗(傻了,瞅过一眼,没答出来)
4.平时做项目,大概过程是什么样的(应该是想问数仓如何建模,答跑题了)
5.hive中排序关键字有哪些,区别是什么
6.hive分区函数了解吗(基本没答出来,这时感觉已经gg)
7.where和join进行连接时的区别
8.有没有对hive进行性能调优过(答的数据倾斜,讲了一下map join,面试官不是很满意)
9.mr为什么不能产生过多小文件
10.规范化,一二三范式说一下,举例子
11.mysql引擎了解吗,知道哪些,具体说一下
12.udp,tcp说一下
13.三次握手、四次挥手
14.有一个1G的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小1M,返回频数最高的100个词
15.成绩表score:学生id,学科id,成绩score;学生信息表student:学生id,学生姓名name,学生性别,写出查询各科成绩前三名的学生信息(写的不好,面试官引导了)
反问:
1.平时工作主要做什么
2.大概什么时候会接到通知
表现不好,以为没了的,过了两个小时通知二面,约了14号下午5点
二面,35min
出了点问题,麦克风没声音,没调出来,打电话语音的
1.自我介绍,问了下个人情况
2.之前实习主要做什么,数据量多大
3.了解mr的过程吗
4.看你对这一块挺了解的,mr过程会进行几次排序,为什么要进行排序
5.平时对hive进行过调优吗
6.对数仓这一块了解吗(讲了事实表维度表,三个模型)
7.一道sql题,跟一面类似,写的不够好
8.常用的数据结构
9.判断一个链表是否有环
10.个人情况
反问:
什么时候能收到通知
二面感觉很nice,面试官人很好,两轮下来最大问题就是sql问题比较大
======================================================
5.20收到感谢信,攒经验了,哈哈哈哈哈