大华大数据开发面经

    作者:牛客884219386号
    链接:https://www.nowcoder.com/discuss/605674?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    大华一面:
    1.实习的过程中有没有什么编码情况?

    2.问做过什么项目?

    3.在etl项目中具体做了什么?

    4.项目中的mr是怎么写的?

    5.reduce的规则是什么?

    6.java的反射和动态代理的原理?

    7.String,StringBuffer,StringBuilder的主要区别?

    8.JVM的内存划分,以及每个都是干什么用的?

    9.栈溢出会报什么错误?

    10.线程池?

    11.ConcurentHashMap高效的线程安全的实现?

    12.是怎么分段的?

    13.自旋锁,偏向锁,可重入锁,轻量级锁?

    14.sparing,springboot,等开发框架有了解吗?

    15.知道哪些设计模式设计模式?

    16.生产者消费者模式是用在哪个场景下,是怎么使用的?

    17.网络的优先控制机制?
    消息怎么样快速发送,和达到上限怎么抑制,以什么样的方式判断消息量 ,滑动窗口等…

    18.http的长链接和短连接?

    19.加入现在有几亿个整数,只有一个数和其他的数是不同的,怎么找出这个不同的数?

    20.乐观锁和悲观锁?

    21.mr的基本原理?

    22.map如何决定它是进入哪个reduce的?

    途牛一面:
    1.hdfs是通过哪个中间件去存储数据的?

    2.结合wordcount述说mapreduce?

    4.hdfs读写数据?

    5.namenode返回元数据?

    6.mapreduce数据倾斜产生的原因以及如何解决?

    7.spark会不会,没问?

    8.hive的内部表和外部表,为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构?

    9.为什么用外部表更好?

    10.left join和inner join ,right join的区别?

    11.几个sql很简单,left join

    如何获取A表中有,B表中没有的记录

    12.统计函数,max,min,avg有三个人,几门课的成绩,求平均成绩?

    13.hive的UDF实现过程,UDTF,UDAT?

    14.hives使用udf函数,要将代码上传到服务器,注册函数,才能使用?

    15.常见的集合类?

    16.ArrayList和LinkedList的区别?

    17.为什么LinkedList更适合插入和删除?

    18.遍历Hashmap的数据的方式?

    19.hashset为什么不能重复?

    20.ConcurrentHashMap?实现线程安全是用什么?

    21.java的线程池?

    22.有new过线程池吗?

    途牛二面:
    1.问项目

    2.mysql和hive的区别?

    3.redis原理,redis的存储数据类型?

    4.redis一般会有哪些问题?

    5.缓存雪崩,怎么去处理,如何设置key分批失效?

    6.冒泡和快排的基本思想和时间复杂度?

    7.二叉树有什么优点有什么缺点?

    8.一个文件中有1000个单词,查询这1000个单词中,字母出现的top10