当前目录
全盘
查全部
文件夹
文件
主页
/
2022年
/
5月
/
33.奈学-P8 百万大数据架构师一期【完结】
/
01 spark 调优
/
01 预习分布式计算应用执行机制.mp4
02数据倾斜发生的现象.mp4
03数据倾斜发生的原理.mp4
04数据倾斜的危害.mp4
05数据倾斜是如何造成的.mp4
06避免数据源倾斜HDFS.mp4
07避免数据倾斜-Kafka.mp4
08定位处理逻辑 - Stage 和 Task.mp4
09查看导致倾斜的key的数据分布情况.mp4
10经典面试题.mp4
11数据倾斜的解决方案01使用Hive ETL预处理数据.mp4
11数据倾斜的解决方案02 调整shuffle的并行度.mp4
11数据倾斜的解决方案03调整shuffle操作的并行度.mp4
11数据倾斜的解决方案04采样倾斜key并分拆join操作.mp4
11数据倾斜的解决方案05将reduce join 转为 map join.mp4
11数据倾斜的解决方案06两阶段闭合.mp4
11数据倾斜的解决方案07使用随机前缀和扩容RDD进行join.mp4
11数据倾斜的解决方案08任务横切.mp4
11数据倾斜的解决方案09多种方案组合使用.mp4
11数据倾斜的解决方案10自定义Partitioner.mp4
12开发调优04尽量避免使用Shuffle类算子.mp4
12开发调优05使用Map-Side预聚合的Shuffle操作.mp4
12开发调优06使用高性能的算子.mp4
12开发调优07广播大变量.mp4
12开发调优08使用Kryo优化序列化性能.mp4
12开发调优09优化数据结构+融化贯通.mp4
12开发调优1-3.mp4
Copyright © All rights reserved.
信息加载中,请等待...