后台/大数据相关,春招个人面经,谢谢牛客

    作者:愤怒带来强大
    链接:https://www.nowcoder.com/discuss/190359?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    腾讯提前批(get offer)
    一面
    1、大数据流处理技术各个的区别和联系
    2、大数据批处理技术各个的区别和联系
    3、项目相关(背景,个人职责和收获)
    4、Hive和HBase的存储区别
    5、HDFS介绍、读写特性
    6、Elasticsearch的介绍
    7、ES和HDFS的区别
    8、倒排索引
    9、科研相关(背景、技术)
    10、学习、生活上的爱好等
    二面
    1、开放性问题,根据具体业务设计数据库
    2、科研介绍,详细问自己的创新之处
    3、生活上爱好,有没有女友(???受到暴击)
    三面
    是部门的老大,很有压迫感
    1、抛开你项目中的数据迁移模块,自己设计一个数据迁移系统,要求保证可靠性和高效性
    2、HDFS HA集群搭建过吗?是个什么架构?NN只有一个吗?SNN干嘛的?能接替NN吗?
    3、如果让你设计一个分布式文件系统,需要考虑什么?你的设计有什么好处,有什么缺陷?
    4、你受到的最严厉的一次批评是什么?
    HR
    1、职业规划
    2、城市选择
    3、实习经历让你收获了什么
    4、实习和在学校有啥区别
    5、为什么想来腾讯实习
    阿里巴巴(被捞了两次,历时一个半月终于不久前上岸)
    阿里妈妈一面
    1、快排时间复杂度?最好什么情况,最坏什么情况?有什么改进方案?
    2、写了个题,忘了,剑指offer里面的一个
    3、spark执行机制,RDD、DAG等
    4、搜索引擎基本原理,倒排索引
    5、中文分词算法(面试官一点点引导)
    6、大数据问题,很大的表和小表join怎么优化?
    7、OS进程通信方式
    8、spark内存模型,如何解决OOM问题?如何解决SOF问题?
    有点久远,其他不太记得了……这次面了将近80分钟

    阿里健康一面
    1、HDFS DataNode死了怎么办,NameNode发生了什么变化?
    2、JVM GC回收算法,各自优缺点,什么场景使用?
    3、HashMap get和put源码,为什么红黑而非平衡树?
    4、CHM结构,1.7/1.8区别?
    5、排序时间复杂度/空间复杂度,插入,归并等,很大的绝大部分有序的数组已经在内存,选择什么排序算法,时间复杂度?
    6、大数据问题,10G的文件里面的数字排序
    7、HA HDFS Zookeeper什么作用,为什么要Zookeeper?

    阿里健康二面
    1、小白鼠问题。16瓶正常水,1瓶毒水,小白鼠喝下毒水后一小时死亡,只给一小时时间,最少用多少只小白鼠可以检测出14瓶正常水?
    2、两根质地不均匀但是燃烧时间与绳子长度无关的一样的绳子,燃烧完一根绳子耗时一个小时,只能用这两根绳子,如何准确烧出15分钟?
    3、数据库隔离级别,哪些导致脏读,哪些导致幻行?
    4、分代收集算法
    5、G1垃圾回收器
    6、线程池的核心参数,几种队列,分别干啥的
    7、大数据流处理技术之间的实现原理以及区别
    8、Hadoop1.x和2.x之间的区别
    9、你的实习经历中ES怎么调优的?
    10、详细问项目(背景,职责)
    11、生活上爱干啥

    阿里健康三面
    这是部门老大
    1、HBase架构,为什么其随机查询很快?
    2、ES如何调优?
    3、项目中让你出乎意料的收获?
    4、小学的时候印象很深刻的事?正反面各一个
    5、总结本科的学习,有什么方*?自己认为做的好的一点是什么?
    其他还聊天聊了很久。

    阿里交叉面(阿里云的高P大佬)
    1、科研,问的很详细,背景、技术架构、意义
    2、科研落地的话,要考虑什么问题,有什么不足?
    3、ES查询机制?
    4、一个分布式系统,为什么测试的时候响应很快,而到实际线上部署时响应就会变慢?分析可能原因并给出理由
    5、分布式系统CAP理论,重点解释分区容错性的意义
    6、大数据的特性
    7、对虚拟内存的理解
    8、有啥想问他的
    阿里HR
    1、除了简历中的技术,还对什么技术感兴趣
    2、城市选择
    3、职业规划
    4、怎么看待之前的面试官?有留下深刻影响的吗?

    拼多多(get offer)
    一面
    1、数据库隔离级别、底层原理、每个级别如何解决上个级别的问题?
    2、mysql 间隙锁实现方式
    3、socket含义?实现方式?
    4、HDFS写数据逻辑?
    5、HDFS EditLog写入了,但是NameNode元信息没保存在内存中,数据不一致怎么办?
    6、HDFS NN作用
    7、快排空间复杂度分析
    8、Sqoop2的实现原理和架构?如果你用MapReduce程序实现数据迁移,Map任务怎么设计,比如给你一张表要迁移

    二面
    1、数据库索引,B+树细节
    2、分布式机器学习架构,科研很详细的问
    3、还了解其他分布式机器学习相关的吗
    4、看过什么源码,怎么看的?
    5、java单例模式的实现,DCL如何保证线程安全
    6、HDFS写入流程讨论

    三面
    1、手撕反射私有变量,反射泛型方法
    2、二分查找,变形
    3、Spring AOP
    4、Spring中的动态*有几种?分别什么特点?
    5、Struts2和Spring MVC的区别?
    6、Select epoll实现原理和区别?
    7、Java类的生命周期,变量赋值在什么阶段?
    HR
    1、职业规划
    2、如何看待拼多多
    3、城市选择
    4、喜欢什么偶像
    5、实习经历给你的收获

    奇安信(面完没消息,说是6月统一通知)
    一面
    1、项目介绍,问得很细
    2、科研介绍
    3、Golang的体会?并发的特点?
    4、项目中怎么用spring的?
    5、平时对java的调优?

    二面
    1、ES架构
    2、项目介绍,如何对ES调优的?
    3、以wordcount为例,说明MR的执行机制
    4、mysql索引
    5、mysql如何调优?
    6、JVM回收算法

    HR
    1、实习经历的收获
    2、项目、科研经历从立项到调研到实验中思路和遇到的困难,怎么解决的
    3、一句话介绍自己,要体现优缺点,并说明为什么
    4、本科时对未来的规划

    美团(今天offer call,目前遇到的效率最高的,一共连续三个工作日)
    一面
    1、HashMap底层、CHM底层
    2、强引用、弱引用、虚引用等,ThreadLocal可能导致的内存泄漏问题
    3、JVM中的锁
    4、Lock和synchronized的区别
    5、除了锁,其他保障线程安全的方式
    6、同步块外部执行wait和notify能达到效果吗?
    7、MyISAM和InnoDB的区别
    8、隔离级别
    9、间隙锁
    10、HBase整体架构
    11、HBase和MySQL区别,取代的可能性,场景等
    12、Redis HA架构
    13、Hive order by和sort by的执行区别
    二面
    1、Hive和HBase区别,使用场景
    2、HBase架构,ZooKeeper作用
    3、HBase Region分裂,怎么分裂的,父Region是直接删掉了吗?
    4、Spark RDD的理解
    5、Spark map和flatMap区别
    6、Spark在集群中怎么执行程序的?如果有聚合操作呢?
    7、Java Concurrent包里面用过什么?列举一些
    8、Java读写锁,为什么并发读要加锁?
    9、Java线程池核心参数,用到的几个队列分别介绍
    10、Java 使用synchronized关键字有什么隐患?
    11、如何终止一个正在运行的线程?
    12、JVM CMS垃圾回收器和G1之间的区别?G1详细是怎么回收垃圾的?
    13、JVM如何判断对象是否可回收?
    14、什么时候、什么情况下会发生GC回收?新生代和老年代分别介绍
    15、Java调试命令。看线程运行状态用什么?看堆栈信息用什么?
    16、Spring和Spring Boot的区别?
    17、Spring Boot的缺陷是什么?
    18、XML配置和注解配置各自的优缺点?
    19、ES查询到很多数据(100万、200万),怎么返回?
    20、倒排索引数据结构的理解
    21、如何理解排序的稳定性?哪些是稳定的?哪些不稳定?

    22、快排原理

    很感谢牛客这个平台,都是优秀的人在一起交流。
    总的来说,我觉得自己基础还是蛮差的,本科没好好学,因此春招给我机会补这些,觉得提升了不少,心存感激。
    秋招再战!