1

—————-海康威视:数据工程师—————
一面9.25
1自我介绍
2问了项目+实习
3了解过哪些大数据组件?
4hadoop伪分布怎么搭的?
5有做过数据分析吗?(以前做过,太久了就说没有,我也不太想做这一块)
6怎么看待数据工程师这个职位的?
7调研了解过吗?其他人怎么做的
8数据库,怎么删除表里面重复的数据(没有主键)?
select a, b from t group by a,b

9有没有了解过海康?
反问:
后续流程?
面试结果多久出?
公司数据处理的组件

2

一面
电话面 30min
1. 自我介绍
2.在jd实习具体做的什么事情,用到哪些组件
3. hive怎么用的,数据倾斜遇到过吗(没,但就是背)spark的运行流程介绍下(1.spark的driver运行过
程, 2.提交yarn资源调度)
4. zk你平常怎么用的,zk一致性算法说下
5. 介绍下选举算法
6. kafka知道多少,(从组件架构、topic、partitio、replication 、log文件、segment 、index文件 log文件
,卡法卡为什么那么快说)
7. 你刚刚在·说kafka读也很快,怎么实现的
8. java有几种创建对象的方式(不清楚
9. 用class创建对象知道吗(不了解
10. 介绍下jvm(
5个区域、gc方法、回收器)
11. 一个亿的数据,取最小的一千条(单机情况解答:维护大顶堆;集群情况:重写partition函数,每个分区界限是一亿 / partition 数量 的倍数,保证分区间有序)
12.反问:部门主要做智能化,涉及数据挖掘、组件自研、数仓;就业务、技术两方面给点建议
总结:加上之前实习经历来看,海康面试八股背的面试官赞口不绝就ok,没啥难度

3

二面
想投大数据算法工程师的,但是现在投成了开发工程师,想着硬着头皮面吧
首先是自我介绍两分钟,然后开始深挖简历的内容,主要是实习项目的一些细节,主要问了以下几个方面
做算法的目标,缺失值的处理,算法用了哪些字段,模型精度如何,怎么产生效益
再就是提问环节:
1. Java的多线程
2. Java的垃圾回收机制
3. Spark的RDD是什么,你怎么理解
4. 机器学习模型中,哪些不需要做归一化
反问环节,问题问面试官,问了两个
1. 大数据开发岗位主要做什么业务
2. 面试官当初为什么选择xx公司,或者说xx公司有什么吸引你的地方
总体来说还可以,后面提问环节很多没答上来,估计挂了吧
不过还是许愿一个offer!

4

昨天打电话过来我在车上没接到,然后说约面试时间,定了今天。
校招,投了很久了,筛选直接没笔试,上午电话面试大概20分钟。
一、语言方面:
1. 说说擅长的语言?
(java我实在是不敢说擅长,只说的python,然而面试官可能觉得和shell一样很简单了,就不想问。当然
最后建议我还是补上java,说JVM、GC那些不看也罢)
二、大数据组件方面:
1. 说说了解的大数据组件有哪些,然后展开;
2. 我说Hadoop,结果偏偏没问我HDFS、MR这两个算熟悉的,问了yarn,yarn提交程序的流程?
3. Flink和Spark对于批处理的区别?
4. Spark了解多少说多少。
(这种是第一次遇到还能这么问)
5. Spark宽窄依赖了解吗?区别。
(这个应该答上来了)
6. Hive和HBase了解多少说多少。
7. 还了解kafka、ES这些吗?
8. 结合项目哪里用了哪些技术点,数据怎么存的,怎么处理的等等。
(感觉自己还是没理得太清,虽然都是自己做的)
9. dataset和dataframe区别;
三、其他
1. 有啥想问的。
2. 看了看志愿地点是成都重庆深圳,愿不愿意去杭州,并且说了下成都重庆杭州的海康分别做什么的;
计算机基础课、算法题目一个没问,全程轻松,面试官人很好,而且明显就是搞大数据的,我没答上来的
也补充了,不得不说上一个公司第二轮面试随便找个技术主管来问,大数据啥也不问。

5

一面
电话一面:
1、自我介绍。
2、说一下HBase、HDFS的结构?
3、HBase中读写数据的过程?读取数据如果本地Client缓存的meta表失效了,这次查询会失败么?
4、Spark任务的提交过程和执行流程?
5、Spark源码读过么?
6、Hive的执行过程?
7、JVM说一下吧,越详细越好。内存划分、GC什么的。分代收集?
8、String s = “Hello World”,涉及到内存的那些位置?String类型是Java的基本数据类型么?它可以被继
承么?
9、StringBuilder和StringBuffer的区别?
10、sleep和wait的区别?会不会释放锁?
11、Java中一个线程可以如何实现?
12、Java线程池怎么实现?分类?
13、如果说要给你调整工作岗位你可以接受么?
14、你还有什么要问我的?

6

4.29号更新,收到二面通知了,是钉钉群面试的形式,还是技术面,不过问的比较水,祈祷HR面以及
Offer!
海康威视大数据开发(杭州)暑期实习二面 4.29号(39min)
自我介绍
详细问项目,项目背景,为什么这么做,怎么进行优化
论文的思路以及背景
JVM分为哪几个部分
Spark为什么比MR快
启动hadoop,都会有什么进程
NameNode和DataNode的作用?
Yarn中的AM和RM的作用?
有任务来的时候,Yarn怎么进行调度?
base想去成都还是杭州?为什么?闲聊10分钟

海康威视大数据开发(杭州)暑期实习一面 4.23号(40min)
自我介绍
Spark的算子有哪些?懒加载?哪些算子会有shuffle过程?
Spark的shuffle过程?
数据库的索引结构?B树和B+树的区别?为什么不使用哈希索引?
HashMap的实现原理?
堆排序的原理以及数据结构
深挖论文里的实现细节以及创新点
口述代码思路
数组中的第K个大数
两数之和,时间复杂度和空间复杂度
想问下有没有同学面试这个岗位的….觉得答得还可以诶,不晓得有没有二面的机会….现在的状态码是
CRS_ZYFS_YFK…是凉凉了吗?

7

9.26亚朵酒店面试
面试岗位:大数据开发
1.第一面
面试官主要问了:
1.项目上的一些事情:
1.1具体介绍项目…
1.2目如果任务延期怎么办?
1.3.项目中遇到了哪些问题,如何解决?
2.java基础
2.1.Java基本类型以及占的空间
2.2.Java中的原子性
3.hadoop
3.1.如何实现高可用
3.2.datanode节点了解
二面是个好看的小姐姐,眼睛超大
1.为什么来海康
2.准备在工作中向哪个方向发展
3.如何在工作中发展学习(大概是这个意思吧,被问懵了)
4.五个词形容自己
5.自己优缺点

8

晚上在实验室突然接到来一个自杭州的电话,海康威视的电话面试(大数据岗),以下是问我的问题:
1.大数据相关的项目你做过哪些?(
因为岗位要求是熟悉Java和框架,熟悉Hadoop,HBase,然而尴尬的
是楼主实在没什么大的出手的大数据项目,所以面试官就说那就问你一些JAVA基础吧 )
2.说一下垃圾回收算法?
3.JVM新生代和老年代哪个空间占得比较大?
4.Eden区和Survivor的比例?
5.集合类你用过吗?有哪几种Set?
6.HashMap?
7.HashMap和HashTable的比较?
8.HashTable和ConcurrentHashMap的区别?
9.梯度下降算法?
本来说是8月份才面试的,突然打电话来,没什么心里准备, 面试官还是很专业的,如果想去海康的同学
好好准备吧。

9

一面
1. 说了一下项目
2. 简历里面哪个框架你最熟悉?
3. 谈一谈你对Hadoop的理解,基础架构及原理
4. 2NN的全称是什么?为什么需要2NN?
5. 如果没有2NN,只有DataNode,NameNode行不行?
6. MapReduce中有没有涉及到排序?
7. 说一下shuffle,为什么Map端输出的时候需要排序?不排序直接输出难道不好吗?
8. Container的启动过程了解吗,它是如何启动的?
9. Container如何限制磁盘的大小?
10. 搭建集群环境中遇到的最大的挑战是什么?解决之后有没有思考为什么是这样?
11. 反问

10

3.海康威视,杭州。大数据开发
楼主没做笔试,可能是暑假内推,本以为挂了,最后还是幸运的接到了面试。
一面技术面,稀里糊涂的,还是java基础,多线程线程池问的较多,可能回答的不是太差,就问了比较
细,线程池内部的原理,也就是源码之类的吧,楼主看过一点,又吹了一波,然后就是实习项目,楼主还
是将面试官引导到kafka。个人感觉一定不能让面试官带你,你要有主导权,面试官都很好的,他目的不
是刁难你,是想知道你懂多少,深度如何。所以一面就这样过了。
二面HR,问我有没有offer,说了一个苏宁的,那时候只有苏宁的,对于这样的问题,我也就实话实说
了,不知道大佬是怎么回答的。然后给我介绍了公司现状,大概是安防智能家居之类的,楼主知道最多的
是海康威视摄像头,感觉到处都是。问了老家哪里的,实话实说。然后问近期的计划是什么,楼主说了,
秋招结束,去旅游啥的,然后回来写毕业论文。其实,秋招结束就在家睡大觉了。为什么楼主秋招结束
了,因为只有英语四级。所以后期的有些国企压根进不去,也没想过会去。所以秋招到此结束吧。
嗯,海康威视也拿了offer.
最后也有好多公司挂了的,就没说,还有没出结果的,南京中兴,不打算等了,华为今年不要91年的,楼
主没有面试资格。苏宁还没谈薪资也就算了吧。总体来说,楼主秋招运气好。没有小论文,只有一篇专
利,也没写在简历上,怕被问蒙。建议:不会的知识点不要写在简历上,会一点的不熟悉的尽量不要写,
写在简历上的一定是自己熟悉的,熟悉的东西尽量去看看源码。比如String类中的contains方法内部是如
何实现的,HashMap源码如何实现的,都可以看看。找工作一半实力,一半运气。当然实力十足的基本上
都会有好好工作。楼主靠的运气😂。

11

大数据开发岗 一面9.15二面9.18
一面 23min
1. 自我介绍
2. 问项目(这个问的有点多,主要是根据项目延伸的知识点有点多)
3. 详细说一下hdfs
4. hdfs读写流程
5. yarn调度流程
6. 说一下hive
7. flume和kafka是怎么配置的
反问环节
二面 34min 钉钉视频
1. 自我介绍
2. 项目询问
3. mybatis运行流程
4. 双亲委派机制
5. 如果打破双亲委派机制,加载了不同系统同名的类会出现什么问题
6. jvm内存模型
7. 创建类的几种方式,他们的区别(确实好久没看java了,Thread和Runnable区别我都记不清
了!!!!!!!!!)
8. hadoop组成以及各部分的运行原理流程
9. hive和hbase区别
反问环节
许愿,二面求过

三面 通用素质面 12min
1. 自我介绍
2. 哪里人
3. 有没有女朋友,女朋友哪里的
4. 介绍一下项目创新点、技术选型
5. 为什么使用这些技术选型,怎么考虑的
6. 手上有没有offer,薪资多少
7. 对工作地点怎么看
8. 你期望薪资多少

12

首先本人情况:双非在读研究生研二,自学的大数据理论和框架。
面试官人真的超好😂
①先让做自我介绍。
完了问一下简历里面的一个在线数仓教育平台项目的内容,介绍项目,自己负责的部分,如何实现的。
说实话这是我第一次面试,也比较紧张。而且这个项目做的也不好,所以回答的都是乱编的,面试官可能
听出来了,让我自己找一个比较熟悉的项目进行介绍~问了项目的相关问题。
②问了大数据相关的原理kafka,yarn,hdfs等,回答的也不好。
③问了一些学校的课程及自己的论文一些相关问题。
时间:2023年2月15日
视频面试
2月17收到了HR面试
下午收到了offer
总结:发现自己平时学的,很少具体实践,导致自己都忘记了