IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> hadoopsparkscala大数据分布式系统汇总 -> 正文阅读

[大数据]hadoopsparkscala大数据分布式系统汇总

20210724

=> 等号 箭头相当于 函数的冒号

偏移量可以理解为索引

在这里插入图片描述
本地模式:想什么时候用就什么时候用
开发环境:用一次就没有了?

配置高可用 (HA)

在这里插入图片描述

在这里插入图片描述
独立模式和yarn 模式
独立只需要spark自己不需要其他第三方框架
yarn模式需要第三方比如hadoop等

在这里插入图片描述

集群模式和客户端模式的区别?
集群模式在控制台看不到结果客户端模式可以看到结果
driver 在集群里面运行的就是集群模型,在集群之外为客户端模式

yarn 属于hadoop

driver 和 executor 是和计算相关的组件
master 和 worker 是和资源相关的组件

driver 通过 application master 和master 交互

executor 是进程
core 是cpu核

有向无环图:依赖关系 A 用到了B 表示 A依赖于B
有环的话就是死循环

在这里插入图片描述

driver 和 executor 都是进程
网络编程就是socket 编程

https://www.zhihu.com/question/62807679/answer/548195113

class 是类
object 是实例

网络中不能传对象,但是可以把对象序列化

普通的java类不能序列化必须 extends(扩展) serializible (抽象接口)
scala 中所有java的接口都是叫特质

scala var 和 val 的区别

RDD 最小的计算单元
多个RDD(各种复杂的操作)联合起来形成完整的计算

数据结构:组织和存储数据的结构

字节流和字符流不同
字节流:一个字节一个字节地读

bufferedinputstream 缓存流 批处理

一行一行读 是字符流 而不是字节流

bufferdreader 是字符流
bufferedinputstream 是字节流

在这里插入图片描述
字节转字符
在这里插入图片描述
装饰者设计模式 :在原来的功能上扩展更丰富的功能 (包装就相当于 参数传入)
真正读取的还是最里层的fileinputstream
RDD 中途不保存数据,IO 要缓存

utf8或者其他编码模式 所需的字节数不一样

各种new 只是设计的功能模块
真正触发执行地是 in.readline() 延迟执行的感觉

在这里插入图片描述

在这里插入图片描述
函数中的this 相当于就是调用者自身

弹性就是可变的 不是固定的

分片 等于 分区
子类重写抽象类的方法
先分区后可并行计算

option 可有可没有
executor 在不同的节点中?

driver 做调度

scala中var 和val的区别
Scala有两种变量,val和var。val就不能再赋值了。与之对应的,var可以在它生命周期中被多次赋值。
在这里插入图片描述
相对路径 以当前根目录为基准

从文件中构建RDD是一行一行读取 是字符 类型为string
从内存中构建RDD是一个字符一个字符的读取? 如果是列表里面数字 则类型为int?

scala 类型推断

  • 通配符 可以有可以没有
    在这里插入图片描述

分布式存储系统路径 HDFS
crc 校验和状态文件

在这里插入图片描述
抽象的方法 在特质(trait)当中 不能直接运行

真正用的是具体执行的类 ctrl+H

taskscheduleimpl

035 035.尚硅谷_SparkCore - 核心编程 - RDD - 集合数据源 - 分区的设定
8分钟左右的追踪可以借鉴学习

0 until numslice 左闭右开

i=> xxx 对i进行右边的操作

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-07-24 11:33:51  更:2021-07-24 11:34:12 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 0:19:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码