课程目录: 第1章 课程介绍 课程介绍
1-1 PySpark导学 1-2 OOTB环境演示 第2章 实战环境搭建 工欲善其事必先利其器,本章讲述JDK、Scala、Hadoop、Maven、Python3以及Spark源码编译及部署
2-1 -课程目录 2-2 -Java环境搭建 2-3 -Scala环境搭建 2-4 -Hadoop环境搭建 2-5 -Maven环境搭建 2-6 -Python3环境部署 2-7 -Spark源码编译及部署 第3章 Spark Core核心RDD 本章详细讲解RDD是什么以及特性(面试常考)、Spark中两个核心类SparkContext和SparkConf、pyspark启动脚本分析、RDD的创建方式以及如何使用IDE开发Python Spark应用程序并提交到服务器上运行
3-1 -课程目录 3-2 -RDD是什么 3-3 -通过电影描述集群的强大之处 3-4 -RDD的五大特性 3-5 -RDD特性在源码中的体现 3-6 -图解RDD 3-7 -SparkContext&SparkConf详解 3-8 -pyspark 3-9 -RDD创建方式一 3-10 -RDD创建方式二 3-11 -使用IDE开发pyspark应用程序 3-12 -提交pyspark作业到服务器上运行 第4章 Spark Core RDD编程 本章将针对RDD中常用的算子进行详细案例讲解,并进行综合案例实战
4-1 -课程目录 4-2 -RDD常用操作 4-3 -......
点击下载
|