美团 大数据研发工程师 一面+二面+HR面 已意向

    作者:弱势角色午夜君
    链接:https://www.nowcoder.com/discuss/752890?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    2面之后发帖子许愿HR面和意向书,现在回来还愿啦~
    楼主个人情况介绍
    学历: 本硕985非科班 自学大数据
    实习经历: 腾讯产品运营实习 腾讯大数据开发实习生

    时间线介绍
    官网投递简历 9.2
    收到笔试邮件 9.3
    笔试 9.4
    一面邀约 9.7
    一面 9.10
    二面邀约 9.10
    二面 9.15
    HR面邀约 9.16
    HR面 9.18
    收到意向书 9.22
    这里要格外感谢美团的面试效率,一面过了一小时不到就约了二面,二面第二天就约了HR面,整个流程非常有效率,比很多磨人的公司好的多。

    复盘
    一面 1h10min
    1. 上来竟然没有要求做自我介绍
    2. 挖项目(我个人是跟着网上的教学视频做了离线数仓的项目)
    你是如何对数据仓库进行分层的
    数据仓库为什么要分层
    你的每一层数仓都做了什么
    关系建模和维度建模的区别
    维度建模的步骤是什么
    你建了哪些维度表和事实表
    什么是事实表?什么是事实
    你是如何将模拟数据导入到HDFS的(业务数据、用户行为日志)
    看你用到了Kafka,为什么要用Kafka
    3. 问实习(除了第一个问题,剩下的问题都是关于第二段实习的内容)
    为什么第一段实习选择运营,第二段实习选择了大数据开发
    实习主要都干了些什么(这个我就不详写了)
    写过什么UDF
    怎么完成产品经理的需求,处理好的数据怎么展示给他们
    4.基础知识
    讲一下Hadoop的HA
    讲一下Hadoop的MR流程
    详细说一下Hadoop的shuffle机制
    说一下Yarn的工作机制
    什么是线程
    什么是进程
    进程和线程有什么区别
    5.算法
    【射箭】:给你个数组,存放每一次射箭射中的概率,问你最后能射中几次,及出现该情况的概率。(因为时间关系,面试官只让我写了两轮射箭结果的伪代码)
    我个人算法刷题较少,所以n轮射箭的题目是不会写的,但是刷剑指offer的时候刷到个类似的(我个人觉得有些类似,勿喷),仅供大家参考。 剑指 Offer 60. n个骰子的点数

    一面下来我的自我感觉不错,而且面试官全程都是面带微笑的缓解了我很多压力,面完以后就去实习公司和同事聚餐去了(因为要离职,大家请我吃饭),饭吃到一般收到了HR二面的邀约。
    二面 1h16min
    1.先做一下自我介绍
    2.一面的面试官都问你哪些方面的问题了
    3.上来先写个题吧(一脸懵)
    传来一段字节流,是用户实时输入的一段计算公式,请实时输出这段公式的计算结果(答:不是很会流的操作)
    那你把这段计算公式当做字符串,输出结果(口述了一下,正则)
    在写一个我们社招会出的SQL题吧。已知有一张,交易表订单trans(id,date_str,pro_id,amt,user_id),其他参考信息,已知日期操作函数,date_sub(date_str,INTERVAL 2 DAY),求:1.构建汇总表(日期、当日汇总金额、昨日汇总金额),并初始化表中所有内容 。2.求每天每个产品当日累计交易金额前3的用户。(第二问我用窗口函数做的,面试官让我换个方法,我不会)
    4.挖实习
    做的需求涉及到哪些业务
    产品经理如何评价你做的需求
    为什么不考虑转正
    5.基础知识
    Hive和数据库比较
    为什么在海量数据的场景下使用Hive查找会比使用My SQL查找效率要高
    Hive中的四个by的区别
    Hive中两表进行join的底层原理
    讲一下数据库的范式
    数据库索引是什么数据结构
    比较一下哈希索引、B树、B+树,并分别说明他们的查询时间复杂度
    为什么B+树比B树的效率高
    为什么B+树的叶子结点使用双向链表进行存储
    哈希索引能实现范围和部分查找吗
    数据库使用索引的优势
    数据库索引的分类
    建表如果没有指定唯一索引会怎么样
    索引失效的场景
    模糊查询一定会使索引失效吗
    6.场景题
    有两个表,一个是用户的登陆信息表(其中有用户的id和用户登陆时间),另一张表是用户白名单表
    查询某天登陆的用户中,不在白名单中的用户的id(左外连,简单)
    当数据持续累计,现两表的数据量都变得十分巨大,已经无法放进内存中进行处理了,想一个优化手段。(当时脑子有点短路,没答好,面试完想了一下可能是对表进行分区?)
    7.智力题
    要在一堆果子里面找唯一的一个坏果子,好果子的重量都是一样,坏果子会轻。给你一个天平,你需要通过两次称重来找出坏果子,问:你最多可以在多少个果子中找出坏果子。(我承认自己智力不大行,最开始想的二分,答了四个,显然错误)
    面试官问那我五个就称不出来吗(我想了想,手里拿一个,剩下四个继续称也能称出来,最后最后答了9个)
    面试官解释思路,三分查找
    问那我如果称三次,最多多少果子(答了27个,这思路都告诉你再说错就不应该了)
    8.反问
    问了部门有哪些业务,然后离线和实时的业务比例。

    二面感觉自己表现一半好一半坏,不是很确定自己能不能进入下轮面试,但是不得不承认这个面试官真的很赞,全程都是很温柔的语气,不时会鼓励你、引导你、会很认真的听你讲话,真的非常谢谢他。
    HR面 17min
    我是在二面完第二天的下午才收到的HR面邀约,天知道上午中午我有多焦虑多难受(因为看见很多牛客网大神都是当天收到的HR面邀约 ),收到HR电话的时候贼开心。

    1.做自我介绍
    2.说一个你认为你做过的最有挑战性的项目
    3.爱好是什么
    4.为什么喜欢看美剧,美剧中你最喜欢的一个角色(因为我说看美剧是我的爱好之一)
    5.还投了哪些公司
    6.现在实习的公司的转正怎么考虑
    7.如果一个项目由你自己负责完成,你会怎么处理

    HR是一个非常温柔声音好听的小姐姐,全程非常放松。面完之后大概两个小时后HR小姐姐加了我微信,说后续有什么安排会及时和我同步。

    意向书
    中秋三天难得没有笔试面试给自己放了个小假放松了一下,之前精神真的崩太紧了,中秋假期结束后的第一个工作日上午收到了美团意向书~

    还愿结束~感谢各位牛友的无私分享,感谢美团的超高面试效率,感谢我的一面面试官二面面试官HR小姐姐。接下来还会继续努力,向更多好的offer发起冲击,大家一起加油!