大华大数据开发面经
作者:牛客884219386号
链接:https://www.nowcoder.com/discuss/605674?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
大华一面:
1.实习的过程中有没有什么编码情况?
2.问做过什么项目?
3.在etl项目中具体做了什么?
4.项目中的mr是怎么写的?
5.reduce的规则是什么?
6.java的反射和动态代理的原理?
7.String,StringBuffer,StringBuilder的主要区别?
8.JVM的内存划分,以及每个都是干什么用的?
9.栈溢出会报什么错误?
10.线程池?
11.ConcurentHashMap高效的线程安全的实现?
12.是怎么分段的?
13.自旋锁,偏向锁,可重入锁,轻量级锁?
14.sparing,springboot,等开发框架有了解吗?
15.知道哪些设计模式设计模式?
16.生产者消费者模式是用在哪个场景下,是怎么使用的?
17.网络的优先控制机制?
消息怎么样快速发送,和达到上限怎么抑制,以什么样的方式判断消息量 ,滑动窗口等…
18.http的长链接和短连接?
19.加入现在有几亿个整数,只有一个数和其他的数是不同的,怎么找出这个不同的数?
20.乐观锁和悲观锁?
21.mr的基本原理?
22.map如何决定它是进入哪个reduce的?
途牛一面:
1.hdfs是通过哪个中间件去存储数据的?
2.结合wordcount述说mapreduce?
4.hdfs读写数据?
5.namenode返回元数据?
6.mapreduce数据倾斜产生的原因以及如何解决?
7.spark会不会,没问?
8.hive的内部表和外部表,为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构?
9.为什么用外部表更好?
10.left join和inner join ,right join的区别?
11.几个sql很简单,left join
如何获取A表中有,B表中没有的记录
12.统计函数,max,min,avg有三个人,几门课的成绩,求平均成绩?
13.hive的UDF实现过程,UDTF,UDAT?
14.hives使用udf函数,要将代码上传到服务器,注册函数,才能使用?
15.常见的集合类?
16.ArrayList和LinkedList的区别?
17.为什么LinkedList更适合插入和删除?
18.遍历Hashmap的数据的方式?
19.hashset为什么不能重复?
20.ConcurrentHashMap?实现线程安全是用什么?
21.java的线程池?
22.有new过线程池吗?
途牛二面:
1.问项目
2.mysql和hive的区别?
3.redis原理,redis的存储数据类型?
4.redis一般会有哪些问题?
5.缓存雪崩,怎么去处理,如何设置key分批失效?
6.冒泡和快排的基本思想和时间复杂度?
7.二叉树有什么优点有什么缺点?
8.一个文件中有1000个单词,查询这1000个单词中,字母出现的top10