• 3

唯品会 大数据开发 校招面经

全程也是一个小时左右,面试官职级应该是更高一些,相对比较严格,问题也比较尖锐深入一些,但是也是比较温和有耐心的。

问题整理:

  1. kafka 的 message 包括哪些信息
  2. 怎么查看 kafka 的 offset
  3. hadoop 的 shuffle 过程
  4. spark 集群运算的模式
  5. HDFS 读写数据的过程
  6. RDD 中 reduceBykey 与 groupByKey 哪个性能好,为什么
  7. spark2.0 的了解更简单:ANSI SQL 与更合理的 API
  8. rdd 怎么分区宽依赖和窄依赖
  9. spark streaming 读取 kafka 数据的两种方式


许愿能拿到offer,也希望这篇笔记能对大家有帮助,加油!

相关面经
全部面经
招聘动态
更多动态