作者:牛客826396261号
    链接:https://www.nowcoder.com/discuss/688327?source_id=discuss_experience_nctrack&channel=-1
    来源:牛客网

    前几天投的简历,然后今天去面试。因为知识点还没好好的捋一捋,其实犹豫要不要去面试的。emmmm,确实,很die,面试过程很尴尬,感觉一直是大眼瞪小眼,哈哈哈哈哈,凉凉了,就分享一下部分记得的面试题
    1、RDD的特点,怎么存储数据?

    2、spark的rdd和partition的联系。

    3、RDD的算子了解吗?讲讲foreach算子

    4、shuffle操作的理解?(应该是问那些算子会触发shuffle操作之类吧)

    5、spark 和 mapreduce 区别

    6、HDFS的架构,它们分别具备什么功能?

    7、namenode存数据吗?

    8、HDFS的默认数据块大小是多少?(128M)为什莫是128M?

    (数据块过小:从寻址和磁盘两个方面回答)

    。。。。。。

    最后面试官:有什么问题问他吗?

    没问,觉得面试不过,就觉得没必要问