IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> SparkSession -> 正文阅读

[大数据]SparkSession

SparkContext?作为?RDD?的创建者和入口, 其主要作用有如下两点

  • 创建?RDD, 主要是通过读取文件创建?RDD

  • 监控和调度任务, 包含了一系列组件, 例如?DAGScheduler,?TaskSheduler

为什么无法使用?SparkContext?作为?SparkSQL?的入口?

  • SparkContext?在读取文件的时候, 是不包含?Schema?信息的, 因为读取出来的是?RDD

  • SparkContext?在整合数据源如?Cassandra,?JSON,?Parquet?等的时候是不灵活的, 而?DataFrame?和?Dataset?一开始的设计目标就是要支持更多的数据源

  • SparkContext?的调度方式是直接调度?RDD, 但是一般情况下针对结构化数据的访问, 会先通过优化器优化一下

所以?SparkContext?确实已经不适合作为?SparkSQL?的入口, 所以刚开始的时候?Spark?团队为?SparkSQL?设计了两个入口点, 一个是?SQLContext?对应?Spark?标准的?SQL?执行, 另外一个是?HiveContext?对应?HiveSQL?的执行和?Hive?的支持.

在?Spark 2.0?的时候, 为了解决入口点不统一的问题, 创建了一个新的入口点?SparkSession, 作为整个?Spark?生态工具的统一入口点, 包括了?SQLContext,?HiveContext,?SparkContext?等组件的功能

新的入口应该有什么特性?

  • 能够整合?SQLContext,?HiveContext,?SparkContext,?StreamingContext?等不同的入口点

  • 为了支持更多的数据源, 应该完善读取和写入体系

  • 同时对于原来的入口点也不能放弃, 要向下兼容

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-07-11 16:42:24  更:2021-07-11 16:43:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 0:08:12-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码