好未来大数据开发面经

    作者:梨花雨凉201901311013925
    链接:https://www.nowcoder.com/discuss/707284?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    好未来 一面
    sqoop脱敏

    数据平台如何搭建的,搭建过程遇到了什么问题,如何解决的

    hive的udf udtf udaf

    哪些场景会导致数据倾斜,如何解决

    hive max函数如何实现的

    对建模了解多少

    维度建模和范式建模的区别

    mysql事务的特性以及隔离级别

    浏览器输入URL后发生的事情

    算法:给定一个包含非负整数的 m x n 网格 grid ,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。

    说明:每次只能向下或者向右移动一步。力扣(LeetCode):https://leetcode-cn.com/problems/0i0mDW

    s q l:学号 课程 班级 上课时间 求每个学生 每个课程的最早上课时间以及对应的班级

    hive的排序,以及各自的区别

    好未来二面
    给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

    如果某一个值很多应该怎么处理

    给定100万个数,每个数在[-100,100]之间,请按从大到小的顺序输出他们

    “A(id) values(1,1), B(id) values(1)” select a.id as aid,b.id as bid from a join b on a.id = b.id

    返回结果是什么,替换为left join 或right join呢?

    mysql事务的隔离级别

    私有IP地址有什么

    子网掩码是什么

    127.0.0.1是什么

    介绍实习期间的事情

    反问
    二面感觉还可以,但是面试官把我挂了,已凉,555
    攒好运