蘑菇街数据开发实习二面

    作者:明影当空
    链接:https://www.nowcoder.com/discuss/654830?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    一面过去挺久,记不清楚了。
    刚二面记录一哈:
    自我介绍
    🤠:怎么找实习这么晚?
    🤠: 问我想做哪个方向?数仓?数据平台?数据分析?
    😳 :我其实都不懂,啥都行,面试官解释了一波上面的岗位都干啥的,因为简历上项目写的是关于数仓的,所以我说我喜欢数仓! 🤣
    🤠:OK,维度分析是啥?你项目是按什么来划分主题的?
    😳:我不会。很难受,怎么问的和以前的面试不一样?不问MR吗?Shuffle?JVM?多线程?Linux,数仓基础么得,很难受😵 瞎说一通
    🤠:这个你理解的可能有些偏差,下去可以看看这方面的东西。
    😳:没问题
    🤠:hive sql在你项目中的占比有多少?
    😳:很懵,支支吾吾了一会儿,2/3吧
    🤠:OK,来了一道场景题:统计用户的第一次访问时间,总访问次数
    😳:巴拉巴拉。。。
    🤠:数据量很大,这个查询会有什么问题?
    😳:其实没get到面试官想考啥,最后他提示NameNode会出现啥情况?可能是想考高可用还是其他啥,我不知道,我就扯到HA上去了。
    🤠:我们有一些直播间,想把一些fashion的直播间在首页退出,一些不太fashion的直播间就不在首页推出,你有什么策略吗?
    😳:我以为要考我row_number(),排序,我就说给直播间打分,然后按分数高的排序,将高分的在首页推出。
    🤠:那怎么打分呢?
    😳:这就很萌了啊!我哪里知道啊,就说呗。可以按年龄或者其它属性,给直播间打分啥的,我也不会。
    🤠:你这年龄歧视可不行啊!
    😳:没有,没有,我就那么一说。
    反问环节
    哎,太难了!