Shopee提前批-大数据开发一二面hr面面经

    作者:zhuguli
    链接:https://www.nowcoder.com/discuss/682276?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    面试官是一位小姐姐,人超级nice,面试体验贼棒,大概50分钟结束面试。许愿二面~

    上来先是自我介绍,介绍完毕之后,详细说说在实习期间主要做了什么?
    由于实习的时候用过 clickhouse(其实就当关系数据库存储了一下数据),所以面试官让我讲讲 clickhouse,我给小姐姐说明我只是当数据库用的之后,她就只让我说了 clickhouse 有哪些特点?
    对 java 熟悉吧?JVM 的内存结构?
    volatile 关键字的作用?
    说说 MySQL 的索引?b树与b+树的区别?
    Redis的应用场景有哪些?Redis支持的数据结构?
    40亿条数据,内存只有10G,如何确定一个数是否存在于这40亿的数字里面?
    Spark的作业运行流程是怎么样的?
    Spark处理数据倾斜的方法?
    Kafka作为消息队列,它可解决什么样的问题?
    Hive的文件存储格式都有哪些?
    HQL:行转列、列转行
    HQL:一张表字段有 id,name,date,其中id有重复,问如何拿到最新的date对应的id的name?
    ZooKeeper 如何实现分布式锁?
    了解Linux吧?如何查看占用CPU最高的进程?
    算法题:用栈实现一个队列,提供入队、出队方法?
    ————————————————————华丽的分割线——————————————————————-

    7.12收到二面通知,前来还愿,同时许愿hr面,ball ball了~
    7.18下午二面,面试时长大约1个多小时。

    自我介绍
    介绍自己项目和实习中,自己印象中最深刻的是做了什么?
    sql:用户连续登录问题
    介绍clickhouse
    数据倾斜问题
    jvm内存中,堆和栈的区别?
    Objects类中的通用方法?其中hashCode方法的返回值是什么?
    如何创建一个线程?使用线程设置堆大小?
    jvm垃圾回收机制?
    算法:二叉树的镜像
    sql:求平均成绩大于80,且0001课程分数高于0002课程分数的学生id
    内存只有256M,有两个10G的文件,从这两个文件中找出相同的数字?(只说思路)
    大概就是这些啦,后边要是想起来其他的,会来更。
    再次许愿hr面~
    ————————————————————华丽的分割线——————————————————————-

    前来还愿。二面过了,Hr电话面了,希望能过。许愿一个offer~