作者:vvwsaasgsfsc
    链接:https://www.nowcoder.com/discuss/247998?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    a.JAVA基础
    1.java的几种集合类
    2.hashmap和hashtable的区别
    3.arraylist,linkedlist 和vector三者的区别
    4.java序列化
    5.java 线程池
    b.SCALA
    1.JAVA与SCALA的不同之处
    2.语法上的不同之处
    3.函数式编程的特点和好处
    4.尾递归了解吗
    c.Python
    基础的机器学习模型
    如k-means
    python常用的几个库。

    d.数仓实习经历
    实习期间的两个项目 自己讲 简单提问

    e.大数据
    1.hadoop
    hadoop 分哪几个部分 common hdfs mapreduce yarn
    hdfs 默认的副本数?如果想修改副本数怎么修改
    datanode的副本怎样分布在机架上容灾性最好
    namenode datanode secondarynamenode这几个啥区别
    写一段简单的map reduce程序
    2.hive
    hive是什么?数据仓库
    order by sort by的区别
    hive函数:行转列,列转行
    3.spark
    spark分哪几个部分,有什么作用 spark core spark sql spark streaming …..
    常用哪些算子
    4.HBase 列式数据库的适用场景和优势
    HBase的 rowkey设计原则
    5.实时数仓
    flink了解多少 能讲一下它的架构吗
    f.写代码
    一道java题 2道sql题
    sql题主要就是考察窗口函数 日期函数 分组排序topN