字节跳动春招大数据三面凉经

    作者:User_19
    链接:https://www.nowcoder.com/discuss/181361?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    一面
    自我介绍
    说下Hadoop吧
    Spark任务执行流程
    了解Yarn吗
    了解Zookeeper吗
    Hive的作用
    数据库你都了解哪些内容
    一道SQL:一个表,每门课选成绩最好的三个学生
    编程说思路:1G文件,每行是一个词,内存1M,求词频最大的前100个词
    编程:求前K大的数 (我问能import heapq吗,面试官说算了你说下思路就行……)

    二面
    自我介绍
    Java抽象类和接口的区别
    如何处理数据倾斜
    编程:m*n的矩阵,初始位置(x, y),只能用中国象棋马的走法,走过的位置不能再走,能否遍历矩阵
    编程:输入二叉树,输出平衡二叉树

    三面
    自我介绍
    spark任务执行流程(又一遍)
    spark统计日活,日志文件每行是日期和user_id
    编程:手撕线程池(开始自闭,没接触过)
    计网:从输入URL到展示网页全过程(我之前专门背了但记岔了,被按在地上摩擦)
    多核CPU和多CPU区别
    寄存器和*区别
    (我没学过计算机体系结构……)

    最后我问面试官技术栈需要如何加强,面试官说现在学生的通病就是只关注机器学习算法,不关注计算机基础知识。

    虽然倒在三面有点可惜,但收获还是很大的,也意识到了转专业的自己在基础知识上的不足。要继续加油呀~