2021 字节跳动 大数据工程师 二战校招(一面,二面凉)

    作者:实验台边吃早饭
    链接:https://www.nowcoder.com/discuss/592112?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    一面

    主要考察的是SQL的撰写,特别是HAVING,GROUP BY等的考察(四题)
    第一个在数组中有重复数字的位置 O(n)
    二面

    一、Spark部分
    Shuffle详细 Shuffle Read Shuffle Write 溢写
    有10个Map Task,2个Reduce Task,2 个Executer,每个Executer有两个2 Core

    问Hash Shuffle 产生的文件个数 10 (Map Task) 2 (Reduce Task)
    问优化过的Hash Shuffle产生的文件个数 (2 (Executer) 2 (Core)) 2 (Reduce Task)
    问SortShuffle产生的文件个数 2 (Executer)
    (1 (合并的文件) + 1 (索引))
    数据倾斜问题

    二、项目介绍

    项目目标及难点

    三、计算机基础及通信网络

    数据通信7层/5层
    进程之间的通信
    进程相关问题,进程开销问题
    进程和线程问题
    内存方面问题
    四、算法

    SQL算曝光率

    剑指 Offer 30. 包含min函数的栈 O(1)

    1. 搜索旋转排序数组