字节大数据1面

    作者:微淡蓝光
    链接:https://www.nowcoder.com/discuss/714231?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    Mysql索引

    有哪些索引、区别

    为什么在hive里没用索引

    数据库的三范式

    内连接和外连接

    Mapreduce原理,有几次分组

    给一段sql,问有几个task

    遇到过数据倾斜吗

    数据倾斜的原因

    除了数据倾斜外还会遇到别的问题吗

    Hive调优

    使用过hive的一些参数

    一个任务跑的很慢的话要怎么优化这个任务

    SQL调优有做过什么

    Hdfs的读写流程

    Sqoop的原理,能实现哪些功能

    离线数仓是怎么做的

    每层有几张表,为什么有这些表

    活跃和留存这些表是怎么设计的

    需求的对接流程是怎么样

    数据出现异常的话怎么去排查

    Udf udtf udaf是什么 区别

    Udf从开发到使用的整个流程

    有做过哪些udf,为什么要用udf实现

    项目的技术难点

    Hive和spark的数据倾斜的区别

    写sql题

    算法题是回文字符串