❤️网盘万T资源库,连续7年运营,全站囊括21大品类,资源天花板就在这里,一次投入永久更新
❤️由于资源容量太大,本站仅支持部分资源搜索,部分精选区和书库仅供展示,请点到具体分类中再进行搜索
❤️VIP会员搭载专属目录,可实现全网搜索,无需登陆网盘,专享资源在线下载权益。
2025灵动四区
2025灵动三区
2025灵动二区
2025灵动一区
2025启航二区
2025启航一区
2025领袖商学院
2024领袖商学院
2024更新十区
2024更新九区
2024更新八区
2024更新七区
2024更新六区
2024更新五区
2024更新四区
2024更新三区
2024更新二区
2024更新一区
精选七区
精选六区
精选五区
精选四区
精选三区
精选二区
精选一区
书库四区
书库三区
书库二区
书库一区
稀缺二区
稀缺一区
精选素材
知识学院二区
知识学院一区
当前目录
全盘
查全部
文件夹
文件
主页
/
【2022知识学院合集】
/
★知识学院1
/
【IT专区】
/
IT一区
/
14.极客时间
/
01.专栏课
/
201-250
/
210-零基础入门Spark
/
01丨Spark:从“大数据的HelloWorld”开始.pdf
02丨RDD与编程模型:延迟计算是怎么回事?.pdf
03丨RDD常用算子(一):RDD内部的数据转换.pdf
04丨进程模型与分布式部署:分布式计算是怎么回事?.pdf
05丨调度系统:DAG、Stages与分布式任务.pdf
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.pdf
07丨RDD常用算子(二):Spark如何实现数据聚合?.pdf
08丨内存管理:Spark如何使用内存?.pdf
09丨RDD常用算子(三):数据的准备、重分布与持久化.pdf
10丨广播变量-累加器:共享变量是用来做什么的?.pdf
11丨存储系统:数据到底都存哪儿了?.pdf
12丨基础配置详解:有哪些配置项是你必须要关注的?.pdf
13丨让我们从《小汽车摇号分析》开始.pdf
14丨DataFrame与SparkSQL的由来.pdf
15丨数据源与数据格式:DataFrame从何而来?.pdf
16丨数据转换:如何在DataFrame之上做数据处理?.pdf
17丨数据关联:不同的关联形式与实现机制该怎么选?.pdf
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.pdf
19丨配置项详解:哪些参数会影响应用程序执行性能?.pdf
20丨Hive+Spark强强联合:分布式数仓的不二之选.pdf
21丨SparkUI(上):如何高效地定位性能问题?.pdf
22丨SparkUI(下):如何高效地定位性能问题?.pdf
23丨SparkMLlib:从“房价预测”开始.pdf
24丨特征工程(上):有哪些常用的特征处理函数?.pdf
25丨特征工程(下):有哪些常用的特征处理函数?.pdf
26丨模型训练(上):决策树系列算法详解.pdf
27丨模型训练(中):回归、分类和聚类算法详解.pdf
28丨模型训练(下):协同过滤与频繁项集算法详解.pdf
29丨SparkMLlibPipeline:高效开发机器学习应用.pdf
30丨StructuredStreaming:从“流动的WordCount”开始.pdf
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.pdf
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.pdf
33丨流计算中的数据关联:流与流、流与批.pdf
34丨Spark+Kafka:流计算中的“万金油”.pdf
结束语丨进入时间裂缝,持续学习.pdf
开篇词丨入门Spark,你需要学会“三步走”.pdf
用户故事丨小王:保持空杯心态,不做井底之蛙.pdf
Copyright © All rights reserved.
信息加载中,请等待...