- 3
唯品会 大数据开发 校招面经
全程也是一个小时左右,面试官职级应该是更高一些,相对比较严格,问题也比较尖锐深入一些,但是也是比较温和有耐心的。
问题整理:
- kafka 的 message 包括哪些信息
- 怎么查看 kafka 的 offset
- hadoop 的 shuffle 过程
- spark 集群运算的模式
- HDFS 读写数据的过程
- RDD 中 reduceBykey 与 groupByKey 哪个性能好,为什么
- spark2.0 的了解更简单:ANSI SQL 与更合理的 API
- rdd 怎么分区宽依赖和窄依赖
- spark streaming 读取 kafka 数据的两种方式
许愿能拿到offer,也希望这篇笔记能对大家有帮助,加油!