IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 五天了解大数据|Day1 邂逅Spark -> 正文阅读

[大数据]五天了解大数据|Day1 邂逅Spark

What is Spark?

~ is a multi-language engine for executing data engineering, data science , and machine learning on single-node machines or clusters.

What is the relationship between?Spark and Hadoop?

Hadoop:

  • 大数据生态
  • 运行慢
  • 给了Spark出生的土壤

Spark:

  • 基于内存,快
  • 支持多种语言——容易使用
  • 功能全
  • 易融合

Using:

  • 日志文件,长安区数据的流交流
  • 机器学习
  • 数据分析师交互式分析
  • 各系统间的数据集成和清洗

Core:

  • Spark Core

提供~最核心功能,是下面几个板块扩展的基础

  • Spark SQL

可以使用SQL操作结构化数据的组键

  • Spark Streaming

Spark平台上针对实时数据进行流式计算的组件,提供了丰富的处理数据流的API

  • Spark MLlib

~提供的一个机器学习算法库,学起来较困难

  • Spark GraphX

~面向图计算提供的框架与算法库

The Arch of Sys in Spark

~采用了分布式计算模型的Master—Slave模型。Master是对应集群中含有Master进程的结点,Slave是集群中含有Worker进程结点。

  • ClusterManager:在Standalone模式中即为Master(主节点),控制整个集群,监控Worker。在YARN模式中为资源管理器。
  • Worker:从节点,负责控制计算节点,启动Executor或Driver。在YARN模式中为NodeManager,负责计算节点的控制
  • Driver:运行Application的main()函数并创建SparkContext。
  • Executor:执行器,在worker node上执行任务的组件、用于启动线程池运行任务。每个Application拥有独立的一组Executors。
  • SparkContext:整个应用的上下文,控制应用的生命周期。

Conclude

  • 挺好的通识读物,希望后面会有让人亮眼的操作
  • 了解了新的工具Spark,对于本来就是大数据专业的我可以说算是开光了。
  • 师傅引进门,修行靠个人,与群友共勉。
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-01-25 10:39:53  更:2022-01-25 10:41:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 14:22:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码