滴滴大数据实习生一面面经

    作者:一只菜鸟变菜鸡
    链接:https://www.nowcoder.com/discuss/234979?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    应聘岗位:大数据开发实习生
    时间:34分钟(然后视频突然中断)
    面试体验:很好
    自我介绍结束
    1、伪分布式系统是什么?那么说说HA是怎么实现的?
    2、zookeeper介绍一下,*机制?如果五台机器,一台突然挂掉,那么怎么知道挂掉(说了心跳),心跳在什么时候?然后怎么选主?
    3、说下中文切词的原理?
    4、那么你说的隐马尔可夫定理的发射概率和转移概率怎么算的?
    5、切词中出现的问题?怎么解决的?
    6、还用到哪些算法?(LCS用来去重)
    7、是怎么去重的,逻辑是什么?
    8、阈值截断是什么?怎么做的?
    9、还用到哪些算法?(CB\CF)
    10、那么环境在哪里搭建的?(Linux)
    11、怎样查看磁盘剩余空间?
    12、怎样查看一个文件占用多大的磁盘空间?
    13、什么专业的?c++?(不会,真的没开设这门课,平常不用也没学)、c(学了两年没有用过了,就在数据结构用过)Java(对,Java和Scala。用过Python的)
    14、那么AWK呢?
    15、你用AWK做什么的?
    16、那数据结构学过吧?
    17、都有哪些排序算法?
    18、你说了稳定和不稳定?怎么区别的?
    19、说说插入排序吧?原理(我真的菜鸡啊,有毒啊,说成选择的原理了好菜啊)?时间复杂度?(n^2,面试官:嗯?是n,我真的好菜,这都差点记错,n^2是最坏情况的)
    20、你用过机器学习的逻辑回归或者线性回归吗?
    21、说说逻辑回归的特征选择?与线性回归的区别和联系?
    22、好,你有什么要问我的吗?(问完后面试官正说着,视频断了??????黑人问号脸,关键还无法连接了,提示此会议正在被使用)
    打电话过去,说面试官已经说明情况了,如果有后续就会通知我????
    看来是凉了,我说了zookeeper只是了解,但是问的比较深,有两处没答上路
    还有就是最简单的排序原理竟然说错了,菜鸡啊
    查看文件占用多大磁盘空间我说了ll,我这是脑子发抽啊。
    其余的没问题,就基础的错这么多,超级菜鸡啊。