字节 腾讯 阿里 携程 美团 京东面经 阿里已收意向书

    作者:jarry1
    链接:https://www.nowcoder.com/discuss/638227?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    从三月中开始陆陆续续开始了春招实习的面试,过程坎坷…菜鸡的我现在只拿了携程的offer,也看了很多牛客上面的面经,回馈牛客,许愿一波阿里的hr面+意向书,求求了

    1. <br />update 4.21:<br />一周收到意向书了!春招结束撒花🌸🌸🌸<br />update 4.16:<br />增加京东一二面面经+阿里HR面

    许愿阿里意向书!!
    字节 二面挂
    3.15 一面
    手撕 下一个permutation 紧张懵逼状态。。没写出来
    没问项目和比赛
    数据库的连接方式是 hash join? 如果是笛卡尔积呢?怎么做连接
    Mysql的索引 B+树的特点?
    操作系统 虚拟内存的作用 ? 为什么要有虚拟内存?缺页置换算法
    CPU这一块的了解 (寄存器 运算逻辑单元 控制器)
    大概说一下你对MapReduce的了解 为什么要有多个reducer 整个工作流程 为什么要有环形缓冲区? reduce去哪里获取数据? 拉取完之后怎么输入到reducer端作为输入 如果Key对应的value的很大,不能放内存,应该怎么处理? (应该从头说到尾)
    代码:reduce操作 输入到reducer端的数据是怎么处理好的?手写处理过程
    讲一下垃圾收集器G1,它的特点是啥 除了不区分 G1还有什么特点 可控时间内的响应停顿 怎么保证? 你说G1不区分新生代老年代,其他收集器区分不同年代吗?
    能实习多久 ?
    反问环境
    3.17 二面
    自我介绍
    数据库比赛
    线程池 几种 参数有哪些 拒绝策略讲讲
    spark join的几种实现方式
    Spark 作业提交流程
    RDD stage划分的依据
    spark计算 能否并行
    算法题:
    已知一天内用户登录登出的日志(数据量较大),求这一天用户在线的最大峰值和持续时间段
    • 日志包含字段(userid, login_time, logout_time)
    • 登录登出时间精确到秒
    股票最大利润题 easy

    美团 一面挂
    自己的问题:

    基础不扎实,很多东西说的不全面 冒泡排序写了半天….*
    SQL还是不熟悉,很多东西不知道怎么实现
    问数据库比赛

    两道sql

    抽象类和接口的区别

    equals 和 ==的区别

    List.isempty() list.size()==0有什么区别

    sleep和wait的区别

    进程和线程的区别

    进程的通信方式:

    死锁是什么?死锁的原因和必要条件

    死锁是什么:是指多个进程在运行过程中因争夺资源而造成的一种僵局,当进程处于这种僵持状态时,若无外力作用,它们都将无法再向前推进。

    必要条件:请求与保持、不可剥夺、互斥、环路等待四个条件

    死锁的原因
    Union和Union All到底有什么区别

    Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;

    Union All:对两个结果集进行并集操作,包括重复行,不进行排序;
    Http协议是哪一层

    tcp udp在哪一层 区别是什么?

    三次握手 为什么两次不行?
    事务的四大特性

    delete drop truncate 的差别

    左连接和右连接的区别

    索引的优缺点,什么时候用索引 ,什么时候不用索引
    数据仓库有了解吗?

    数据倾斜是什么?怎么解决数据倾斜?

    你的优势是什么?

    如果你没能入选,你觉得原因是什么?

    携程 一面+二面+OC
    一面 3.24

    讲讲排序算法和复杂度

    讲讲树结构

    聊项目

    聊对大数据的理解

    实习时间

    二面 3.29

    对大数据开发的理解 存储 分析 计算

    存储框架

    使用HDFS作为存储
    Hive做离线数仓
    HBase做实时分析
    计算引擎有哪些:

    MR
    Spark corre Spark Streaming
    flink
    strom
    有开发过实时的项目吗? 没

    Mapreduce 的流程

    hive的存储格式

    TextFile
    SEQUENCEFILE
    Rcfile
    ORCfile
    内部表和外部表的区别

    外部表数据变动怎么和外部表建立联系

    三种方式:

    直接load

    msck repair

    上传数据之后添加分区

    HIve里面自定义函数 UDF UDAF UDTF

    讲讲数据库比赛

    腾讯TEG 腾讯大数据 一面挂

    聊比赛、项目

    设计一个HashMap

    多线程的原理 线程创建的方式

    线程池的底层原理

    设计 内存文件系统 实现ls mkdir addContentToFile 功能 leetcode会员hard题…..

    阿里一面+二面+HR面
    一面 4.1

    问比赛、问项目

    Hadoop MR 流程 shuffle过程

    数据倾斜处理

    职业规划,未来发展

    反问:

    业务

    二面 4.10 总监面

    实体模型设计

    问比赛、问项目

    闲聊:

    家是哪里的?觉得杭州怎么样?
    有什么想问我的?

    HR 面 4.14
    自我介绍
    项目沟通过程中遇到什么困难 怎么解决的?
    项目中遇到了什么问题,怎么解决?
    遇到过失败吗?怎么面对的?
    怎么看待你应聘的这个岗位(数据研发)?
    对我们部门有了解吗?
    你希望通过实习获得什么?
    对工作地点有什么看法?父母对于你有什么期望?

    京东
    一面 4.12 26min
    挑自己最熟悉的一块讲 我讲的MR的全流程+shuffle机制 Yarn讲了一点
    HDFS 块大小为什么是128M 大一点或者小一点 有什么优缺点?
    sql题写思路 用Hive做需要分成几个job ,能优化吗?
    实习时间
    反问:
    业务
    表现怎么样
    二面 4.13 26min
    问项目
    主修课程,有没有大数据方面的课程
    做数据分析用的工具最多的是什么? python pandas
    对于大数据这一方面的理解
    了解到的大数据的工具有哪些
    hive和传统数据库的区别
    hive保证查询的速度有哪些优化
    反问:
    公司对于大数据开发的分层是怎么样?对于能力的要求有什么差别?