面经唯品会大数据开发校招面经

唯品会大数据开发校招面经

全程也是一个小时左右，面试官职级应该是更高一些，相对比较严格，问题也比较尖锐深入一些，但是也是比较温和有耐心的。
问题整理：
kafka 的 message 包括哪些信息
怎么查看 kafka 的 offset
hadoop 的 shuffle 过程
spark 集群运算的模式
HDFS 读写数据的过程
RDD 中 reduceBykey 与 groupByKey 哪个性能好，为什么
spark2.0 的了解更简单：ANSI SQL 与更合理的 API
rdd 怎么分区宽依赖和窄依赖
spark streaming 读取 kafka 数据的两种方式

许愿能拿到offer，也希望这篇笔记能对大家有帮助，加油！

唯品会 大数据开发 校招面经

唯品会大数据开发校招面经