复盘阿里巴巴CBU大数据开发一面面经

    作者:梦飞翔☆
    链接:https://www.nowcoder.com/discuss/624109?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    1.简单介绍下自己
    2.哪个项目有技术含量,简单介绍下
    3.围绕项目,遇到的困难和挑战,数据量之类
    4.简单介绍一下HDFS架构(我竟然当成HBase了,然后一本正经介绍HBase、、、)
    5.(HDFS)的特色,我还是回答的HBase的、、、
    6.他(HDFS)分布式系统,怎么实现的,多机器存储文件怎么交互的,数据一致性怎么保障,有个特色是机架感知了解过么(直到关于HDFS的问题高一段落,两个人的平行交流才算结束,怪我太紧张,心里还寻思机架感知不是HDFS上的么)
    7.MySQL统计分析的极限,数据量多少会变慢
    8.索引有没有了解过,为什么用B+树存储,建立一个索引的时候是新建了一个b+树吗,表里有多少索引就有多少b+树吗,(a)(a,b,c)
    9.MySQL不好的地方,应用的问题,提到了上面7说的,表大会比较慢(给自己挖坑了,不是特别了解的不要提),扯到了大表优化,水平拆分的原则,id怎么拆分比较好
    10.hash什么情况下造成冲突,hash冲突的原理是什么,算法是怎样的
    11.大表已经拆分好了,一万条数据按照用户id拆分到十个分区,查地区是浙江的用户应该怎么查,分区的时候怎么避免这个问题
    12.用过kafka哪些特性,怎么保障顺序性,有没有测试过kafka极限性能,设计原理,怎么设计的,kafka消息能做持久化吗
    13.G1了解过吗,full gc的过程,对系统的影响,jvm所有线程都会停顿吗
    14.对jdk有关注吗,jdk1.8的新特性
    15.7的2007次方最后一位是多少
    16.反问后建议关注新技术,jdk新特性,开源新框架,对新技术的热情
    实际问题接触的比较少,你再准备一下吧,到时候还会再有面试。