字节跳动春招大数据三面凉经
作者:User_19
链接:https://www.nowcoder.com/discuss/181361?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
一面
自我介绍
说下Hadoop吧
Spark任务执行流程
了解Yarn吗
了解Zookeeper吗
Hive的作用
数据库你都了解哪些内容
一道SQL:一个表,每门课选成绩最好的三个学生
编程说思路:1G文件,每行是一个词,内存1M,求词频最大的前100个词
编程:求前K大的数 (我问能import heapq吗,面试官说算了你说下思路就行……)
二面
自我介绍
Java抽象类和接口的区别
如何处理数据倾斜
编程:m*n的矩阵,初始位置(x, y),只能用中国象棋马的走法,走过的位置不能再走,能否遍历矩阵
编程:输入二叉树,输出平衡二叉树
三面
自我介绍
spark任务执行流程(又一遍)
spark统计日活,日志文件每行是日期和user_id
编程:手撕线程池(开始自闭,没接触过)
计网:从输入URL到展示网页全过程(我之前专门背了但记岔了,被按在地上摩擦)
多核CPU和多CPU区别
寄存器和*区别
(我没学过计算机体系结构……)
最后我问面试官技术栈需要如何加强,面试官说现在学生的通病就是只关注机器学习算法,不关注计算机基础知识。
虽然倒在三面有点可惜,但收获还是很大的,也意识到了转专业的自己在基础知识上的不足。要继续加油呀~