字节大数据一二三面+HR面

    作者:牛客817517800号
    链接:https://www.nowcoder.com/discuss/718107?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    字节date数据中台 实习一面(8-17,47min)
    自我介绍

    项目(两个项目都问了)

    数据倾斜问题怎么解决

    MR 过程中有几次排序过程

    sql:公交车人数最高的时间段

    算法:二叉树层次遍历

    一个男孩,一个女孩的概率问题

    瓶盖换水问题

    维度建模步骤

    选择业务处理

    定义粒度

    选择维度

    确定事实

    字节date数据中台 二面(8.20 1h 7min)
    自我介绍

    根据自我介绍聊天(聊了很多)

    离线处理和实时处理的区别

    主要考察 wordcount 细节

    Map默认是HashPartitioner 如何自定义分区

    hadoop 三大组件简介

    SeconderyNameNode 的作用

    计算机基础知识系列

    数据库索引 InnoDB 数据引擎的特点

    事务的隔离级别

    数据库 三大范式

    tcp 为什么是三次握手

    tcp 如何保证可靠性连接

    网络7层架构,各个层都是干什么的

    算法题

    非严格单调递增 查找最靠前的目标数

    二叉树前序遍历

    字节 data数据中台 三面(8.23 50min)
    主要是对知识的理解深度

    如何学习的大数据相关的知识

    介绍一下 YARN

    YARN 的任务提交流程

    有没有读过 MapReduce 相关的论文

    Mapreduce 为什么适合适合大数据存储

    PB级大数据处理时,比如join操作,如何优化

    job, task,work 的区别(涉及spark 不会)

    在集群计算的时候,什么是集群的主要瓶颈(磁盘IO(正解),CPU,内存,网络带宽)

    MapReduce 处理过程

    sql (比较简单,但我没转过来)

    Hive 内部表和外部表的区别

    字节数据中台 HR面(8.24 20min)
    自我介绍

    怎么学习的大数据

    相对于专业大数据有什么有时

    业务结合能力强吗

    办公地地点

    有没有面过别的地方

    反问

    实习时间几点到几点

    薪资待遇