2022秋招大数据开发工程师面经分享

    作者:li1996
    链接:https://www.nowcoder.com/discuss/711536?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    楼主本人是美国留学生,还要冒着危险去美国上线下课,也没有办法提前实习,求职之路充满了艰辛。。今天终于收到了字节跳动的大数据开发工程师意向书,算是秋招的一次阶段性胜利。自此腾出一些时间来分享下之前各公司的面经,希望对大家有帮助。
    本帖会持续性更新,我慢慢写,哈哈哈。。。。而且因为有些已经比较久远,记不太清了,我会尽量把记住的写下来

    百度(搜索技术平台—数据开发工程师)
    结果:楼主8.4号三面完毕,8.6没忍住给面试官发了邮件问结果,面试官回复说“表现很好,不用担心,在走流程”,不过现在依然没收到测评,还在泡池子中。。。
    综合体验:面试官都非常爽快,面试之前都说了只挑你会的问,而且一面二面都是当场告诉我通过了,体验非常好(不过三面被泡池子了。。)三面主管面没有问啥技术问题,主管非常滴和蔼可亲~
    一面:
    数仓分层
    spark提交任务的流程
    spark broadcast的原理
    两道sql(行列转换,窗口函数)
    本来还要靠算法的,看时间没剩多久了就没考,说二面再考(结果二面也没考 😂)
    二面:
    mapreduce流程
    对hdfs的了解
    mysql的存储引擎(我一时没想起来。。扯了点别的)
    java创建线程的方式
    知不知道数据结构?
    (二面只面了30分钟,也是当场给了通过
    三面:
    (闲聊了一个小时哈哈哈。。
    研究生java课的一个项目
    实习收获
    大学社团
    最无法忍受的室友的行为
    学的课程里哪门是最难的?怎么学的?
    说一个你做了不认可的事情的例子

    字节跳动(data数据平台—数据开发工程师):
    结果:8.18意向书
    综合体验:也是给答复非常快,基本都在面试完的1~2小时内约下一面,意向书HR面完一小时之后就发了
    (一开始是一个更偏向业务的组
    一面:
    挖简历,中间穿插一些spark基础知识,数据存储啥的(我太能说了,这一part结束已经45分钟过去了。。)
    UDF的三种类型
    (然后竟然要问统计,我说我没复习,就问了简单的
    怎么判断数据的离散程度?
    数据的量级相差特别大怎么办?
    (然后还问了业务
    抖音计划做一个NBA的板块,怎么衡量成本与收益
    一道sql(窗口函数)
    二面:
    两道sql(窗口函数agaaaaaain)
    spark提交任务的流程
    数仓分层
    感觉这个面试官有点在意我不能实习。。我也觉得他们这个组有点偏数分,当然我并不是很介意,然后就把我转到同部门的另一个组了
    (转到了一个做底层框架优化的组
    一面:
    挖简历
    synchronized 和 ReentrantLock区别
    DNS解析域名过程
    算法:
    1. 输入int n, 返回他的二进制有几个1
    2. 输入int n, 返回二进制[1,n]一共有几个1
    二面:
    二面太顺利了没有答不上来的问题,完全忘了都问了啥,只记得下面俩
    算法:二叉树前序遍历不用递归
    sql(非常简单的聚合)
    三面:
    挖简历
    == 和 equals的区别
    HashMap 的key用自定义类需要做什么
    HashMap 线程安全,手写
    算法:二叉树蛇形层次遍历
    四面主管面:
    不太算是技术面
    挑两个实习项目,说一下接到任务后是怎么开展工作的,中间也有探讨一些技术细节,比如还能怎么优化之类的
    学校课程
    职业规划
    然后主管介绍一些部门架构,说HR很快会联系你(我窃喜哈哈哈
    HR面:
    就不多写了,我感觉HR面不刷人,就是来问想base在哪的。问题很常规,如实回答就好

    腾讯(技术中台—后端开发工程师):
    结果:二面挂
    综合体验:腾讯没有数开岗位,我投了运营开发,然后被后端的捞了,本着学习的态度去面了一下。一面感觉是压力面,面试官比较push人,各种follow up。二面就不多说了。。感觉自己还有很大不足
    一面:
    ArrayList LinkedList区别
    HashMap
    JVM结构
    本地方法栈
    对象放在哪?
    垃圾回收器及应用场景
    happens before
    volatile
    ThreadLocal
    设计秒杀系统(各种抠细节追问,彻底被绕晕)
    算法:leetcode 322
    二面:
    java最新版本是多少?你用的什么版本?最新版有什么改进?(。。。)
    挖简历(因为面试官不太懂数据开发,所以比数据开发问的还细。。)
    算法:判断域名A是不是B的子域