百度数据研发暑假实习现场一面
作者:OfferCall!
链接:https://www.nowcoder.com/discuss/642081?source_id=discuss_experience_nctrack&channel=-1
来源:牛客网
1.讲一下Shuffle过程,reduce如何知道去拉取哪些map的数据
2.map的数量是怎么确定的
3.为什么切片的大小要尽量和物理块大小保持一致,我说了句寻址时间,直接问我磁盘如何寻址的,泪目,直接说不会
4.做道题,给一个文本文件,里面有一万行,每一行有单词,单词有重复的,统计重复次数的前三名,用shell写,写不出来,让我Java,我用了哈希表和大顶堆,说我空间复杂度太大,有没有优化的方式,我说不会
5.数仓是干嘛的,和普通业务数据库有什么不一样
6.olap和oltp知道么,有什么区别
7.说一下数据仓库的五层都是干嘛的,有没有解析的过程
8.窗口函数知道么,讲一讲你知道的窗口函数,有没有自己写过udf
9.mysql都有哪些引擎,他们的区别是啥,mysql的锁知道么,回答说不知道,然后又问我Java多线程里面都有哪些锁,我就讲了sychronized,volatile,cas锁