- 2
Keep 大数据开发 23届校招面经
面试问题:
- 自我介绍
- 项目介绍
- Hadoop能够高性能吞吐的依赖有哪些?
- Hadoop的完整计算过程,包括Map,Reduce过程、任务调度等。
- 数据资源是怎么Partition的?是什么策略?
- Spark常用哪个算子,讲一下原理?
- Spark是依据怎么分stage的?什么是宽依赖、窄依赖?
- Hive除了Query还用过别的操作吗?
- 什么是数据倾斜问题,场景有哪些?常见的解决方法是什么?
- 反问
面试问题:
- 自我介绍
- 项目介绍
- Hadoop能够高性能吞吐的依赖有哪些?
- Hadoop的完整计算过程,包括Map,Reduce过程、任务调度等。
- 数据资源是怎么Partition的?是什么策略?
- Spark常用哪个算子,讲一下原理?
- Spark是依据怎么分stage的?什么是宽依赖、窄依赖?
- Hive除了Query还用过别的操作吗?
- 什么是数据倾斜问题,场景有哪些?常见的解决方法是什么?
- 反问