IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 谈NoSQL发展及架构演进 -> 正文阅读

[大数据]谈NoSQL发展及架构演进

服务器端的架构演进

??早些年,在所有程序员眼中BAT可谓是宇宙厂,是很多人的终极目标。可是谁也想不到当初BAT像依赖氧气一样依赖IOE(IBM:服务器提供商,Oracle:数据库提供商,EMC:存储设备提供商)。有这样一个故事,2008年马云邀请王坚加入阿里,目的是为了解决阿里的“计算力”问题。当时淘宝面临的最大问题就是数据没地方存,IOE并没有扛过高并发。这里我们只关心数据没地方存的问题,如果只是一味的扩大机器数量那么买服务器的钱都不够。关于这个故事大家可以去阿里云社区看看阿里云的这群疯子这篇文章。

??早些年前后端项目基本都是JSP+Servlet。这也就是大家口中的Web1.0时代,这个时代很多应用程序都是用JSP+Servlet开发的。直到2000年左右,谷歌,各种论坛开始兴起,访问量剧增,很多公司面临单机MySQL效率非常低下的问题(APP很大一部分性能取决于服务端)。

??单机MySQL问题的初期解决方案是使用文件来缓存数据,但是访问量继续增大时,文件缓存也招架不住,原因是后台通常部署多个项目,多个项目不能共用一个缓存文件
?
??文件缓存后的解决方案是分布式缓存服务器Memcached,这个阿里至今还在使用,它为多个web项目提供了共享的缓存服务。
?
??大家都知道缓存是直接放在内存中的,读取是非常快的,而直接读取数据库则比较慢。简单说缓存相当于数据库的上一层。(没有什么是加一层解决不了的)
?

Mysql主从读写分离

??随着用户爆炸式增长,数据库的写入压力也变得越来越大。上面的缓存只能解决读的压力,而写的压力却不能解决。这个时候读写集中在一个关系型数据库,压力非常大。解决问题的方案是主从复制来达到读写分离的目的。Mysql的master-slave模式被广泛应用。需要注意的是数据只能从主机写入,同步到从机
?
??主从复制即有主有从,采用增加服务器的方式来提高系统的可用性。一般是1主2从,数据写入主库,后复制到从库中。复制到从库中除了读的作用以外,还能起到容灾备份,保证数据完整性等功能。
?
主从复制的三个步骤:

  1. master将改变记录到二进制日志(binary log)中(这些记录叫做二进制日志事件,binary log events);
  2. slave(从机)将master(主机)的binary log events拷贝到它的中继日志(relay log);
  3. slave(从机)重做中继日志中的事件,将改变反映它自己的数据。

在这里插入图片描述

读写分离

??主从复制后,主机负责写,从机负责读。除此之外,当时还流行分库分表来缓解写压力和数据增长的扩展问题。
??MySQL的cluster集群只能在一定程度上保证程序的可靠性。

在这里插入图片描述

  1. 什么是分库分表?
    顾名思义就是把一个库的数据分到几个库里,把一个表里的数据分到几个表里(简单理解就是复制容器,共同存储数据)
  2. 为什么要分库分表?
    分库分表主要原因是数据库中数据量是不可控的,在未分库分表的情况下,库中的表会越来越多,表中的数据也会越来越多,相应的读写操作也会变多;第二个点就是单机的情况下,数据库的存储能力和处理数据的能力都会达到瓶颈。
  3. 分库分表的实施策略
    1. 水平拆分
    2. 垂直拆分

为什么要学习NoSQL

??jsp+servlet的web1.0时代已经过去,随之兴起的是web2.0时代,这个时候java崛起。天猫都由php转向java。但是大数据时代的来临,一个商品详情里有商品信息,图片信息,大量的描述,视频等,存在在非关系型数据库是不合理的。MySQL是不支持存储图片与视频的,他存放的是一行一列的东西。
??在众多Nosql中,发展最快的就是redis,所以我们要学redis。Redis1s写8w,读11w。NoSQL数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。这得益于它的无关系性,数据库的结构简单。一般MySQL使用Query Cache。NoSQL的Cache是记录级的,是一种细粒度的Cache,所以NoSQL在这个层面上来说性能就要高很多。
?

常见NoSQL数据库

分类举例典型应用场景数据模型优点缺点
键值(k-v)存储Redis,OracleBDB,MemcacheDB内容缓存,主要用于处理数据的高访问负载,也用于一些日志系统等等。Key指向Value的键值对,通常用hash table来实现查找速度快,存储不管value的格式数据无结构化,通常只被当做字符串或者二进制数据
列存储Cassandra ,HBase,Hypertable分布式的文件系统以列簇存储,将同一列数据存在一起查找速度快,针对某一列或几列查询有很大的IO优势功能相对局限
文档存储CouchDB,MongoDBWeb应用(与Key-Value)类似,Value是结构化的,不同的是数据库能够了解Value订单内容Key-Value对应的键值对,Value为结构化数据只针对文档中的某些字段建立索引。数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构查询性能不高,而且缺乏统一的查询语法
图形(Graph)存储Neo4J,InfoGrid,Infinite Graph,FlockDB社交网络,推荐系统等。专注于构建关系图谱图结构图形关系的最佳存储。利用图结构相关算法。比如最短路径寻址,N度关系查找等。很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案

大环境下的问题及现状

3v:

  1. 海量Volume
  2. 多样Variety
  3. 实时Velocity

3高:

  1. 高并发
  2. 高可拓
  3. 高性能

?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-11-18 11:15:08  更:2021-11-18 11:15:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/17 21:37:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码