IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> SQL(Structured Query Language)—结构化查询语言 -> 正文阅读

[大数据]SQL(Structured Query Language)—结构化查询语言

**

一、数据库

**

1.1 基本概念

数据库(DataBase,DB)是用于存储和管理数据的仓库。

数据可以存储在内存和文件中。数据存储在内存中是临时存储;数据存储在文件中是永久存储

1.2 数据库的基本特点

相较于文件,数据库的区别是:

1)持久化存储数据。其实数据库就是一个文件系统

2)方便存储和管理数据

3)使用了统一的方式操作数据库——SQL

1.3 常用的数据库

MySQL(免费开源)、Oracle(收费)

1.4 MySQL数据库

1)我们在电脑上安装的其实是MySQL服务器软件

2)卸载时去MySQL安装目录肇东my.ini文件,找到下面指令

# Path to the database root
datadir=服务器软件安装目录
然后卸载MySQL之后,在删除该安装目录即可

3)配置

MySQL服务启动:

服务(Service)是没有界面的应用程序,是后台应用程序
启动MySQL服务:net start mysql(安装时定义的MySQL服务器名称)
停止MySQL服务:net stop mysql(安装时定义的MySQL服务器名称)

4)MySQL目录结构

1.MySQL安装目录

核心配置文件:my.ini

2.MySQL数据目录

MySQL服务器 = 计算机 + MySQL数据库服务器软件
包含以下结果概念:
  数据库:一个MySQL数据库服务器软件可以包含多个数据库。
         在计算机中一个数据库其实就是一个文件夹。
  表:一个数据库中可以存放多张表。
      其实就是数据库里的文件。
  数据/数据记录:一个表里面可以存放多条数据记录

**

二、SQL(Structured Query Language)

**

2.1 基本概念

SQL其实就是定义了操作所有关系型数据库的规则。

2.2 SQL通用语法

1)SQL语句可以单行或多行书写,以分号结尾

2)可以使用空格和缩进来增强语句的可读性

3)MySQL数据库的SQL不区分大小写,但是关键字建议使用大写

4)SQL中有三种注释

单行注释:-- 注释内容 或 # 注释内容(mysql特有)
多行注释:/* 注释 */
注意事项:
    --后面一定要加一个空格
    #后面有没有空格都可以

2.3 SQL分类

1.DDL(Data Definition Language)数据定义语言

用来定义数据库对象:数据库,表,列等。关键字:create, drop, alter等

2.DML(Data Manipulation Language)数据操作语言

用来对数据库中表的数据进行增删改。关键字:insert, delete, update等

3.DQL(Data Query Language)数据查询语言

用来查询数据库中表的记录(数据)。关键字:select, where等

4.DCL(Data Control Language)数据控制语言(了解)

用来定义数据库的访问权限和安全级别,及创建用户。关键字:GRANT, REVOKE等

2.4 DDL:操作数据库、表

1)操作数据库:CRUD

1.C(Create):创建
    创建数据库:
        create database 数据库名称;
    创建数据库,判断不存在,再创建
        create database if not exists 数据库名称;
    创建数据库,并指定字符集
        create database 数据库名称 character set 字符集名;
    创建一个数据库,判断是否存在,并指定字符集类型(utf8, gbk)
        create database if not exists 数据库名称 character set 字符集名;
2.R(Retrieve):查询
    查询所有数据库的名称:
        show DATABASES;
    查询某个数据库的字符集:查询某个数据库的创建语句
    show create database 数据库名称;
3.U(Update):修改
    修改数据库的字符集
        alter database 数据库名称 character set 字符集名称;
4.D(Delete):删除
    删除数据库
        drop database 数据库名称;
    删除数据库,判断存在,再删除
        drop database if exists 数据库名称;
5.使用数据库
    查询当前正在使用的数据库名称
        select database();
    使用数据库
        use 数据库名称;

2)操作表

1.C(Create):创建
    语法:
        create table 表名(
            列名1 数据类型1,
            列名2 数据类型2,
            列名3 数据类型3
        );

        注意:最后一列不需要加逗号。

        SQL中的数据类型:
            int:整数类型
                age int
            double:小数类型,需要指定有几位小数
                score double(5,2) -- 表示最多有5位小数,保留2位小数
            date:日期类型,只包含年月日,yyyy-MM-dd
            datetime:日期类型,包含年月日时分秒,yyyy-MM-dd HH-mm-ss
            timestamp:时间戳类型,包含年月日时分秒,yyyy-MM-dd HH-mm-ss
                如果将来不给这个字符赋值,或者赋值给null,则默认使用当前的系统时间,来自动赋值
            varchar:字符串类型,需要指定最大字符长度
                name varchar(20) -- 表示姓名最大20个字符

    创建表
        create table student(
            id int,
            name varchar(32),
            age int,
            score double(4,1),
            birthday date,
            insert_time timestamp
        );
2.R(Retrieve):查询
    查询某个数据库中所有表的名称
        show tables;
    查询表结构
        desc 表名;
3.U(Update):修改
    修改表名
        alter table 表名 rename to 新的表名
    修改表的字符集
        alter table 表名 character set 字符集名;
    添加一列
        alter table 表名 add 列名 数据类型;
    修改列名称和类型
        change方式——既修改名又修改类型:
            alter table 表名 change 原列名 新列名 新数据类型;
        modify方式——只修改列的数据类型:
            alter table student modify 原列名 新数据类型;
    删除列
        alter table 表名 drop 列名;

4.D(Delete):删除
    drop table 表名;
    drop table if exits 表名;
5.复制表
    create table student_bak(备份表名称) like student(待备份表名称)

2.5 DML:增删改表中的数据(重点!!!)

1)添加数据

语法:
    insert into 表名(列名1, 列名2) values(值1, 值2);
注意事项:
    1.列名和值要一一对应
    2.如果表名后,不定义列名,则默认给所有列添加值
        insert into 表名 values(值1, 值2);
    3.除了数字类型,其他类型需要使用引号(单双都可以)引起来

2)删除数据

语法:
    delete from 表名 [where 条件] -- 中括号表示写也可以不写
注意事项:
    1.如果不加条件,则删除表中所有记录。
    2.如果希望删除表中所有的记录
        DELETE方式:
            DELETE FROM 表名; -- 不推荐使用,因为表中有多少记录,就会执行多少次删除操作,效率较低。
        TRUNCATE方式:
            TRUNCATE TABLE 表名; -- 推荐使用,删除表,然后再创建一个一模一样的空表,只需要执行删除和创建表两个操作,效率高

3)修改数据

语法:
     update 表名 set 列名1 = 值1, 列名2 = 值2 [where 条件];
 注意事项:
     如果不加任何条件,则会将表中所有记录全部修改。

2.6 DQL:查询表中的数据

1)语法:

SELECT
    字段列表
FROM
    表名列表
WHERE
    条件列表
GROUP BY
    分组字段
HAVING
    分组之后的条件
ORDER BY
    排序
LIMIT
    分页限定

2)基础查询

1.多个字段的查询

    查询某几个字段:
        SELECT
            NAME, -- 姓名
            age -- 年龄
        FROM
            stu; -- 学生表

    查询所有字段:
        1.SELECT * FROM stu;(不推荐)
        2.SELECT(推荐将所有字段列举出来)
            字段1, -- 字段解释
            字段1, -- 字段解释
            ...,
            最后一个字段, -- 字段解释
          FROM
            表名; -- 表名解释
2.去除重复记录
    SELECT DISTINCT 字段名1, 字段名2 FROM 表名;
3.计算列
    一般可以使用四则运算计算一些列的值,需要注意的是,null参与的运算,计算结果都为null
    ifnull(表达式1, 表达式2):
        表达式1:哪个字段需要判断是否为null
        表达式2:如果该字段为null后的替换值
    SELECT NAME(字段1), math(字段2), english(字段3), math + IFNULL(english, 0) FROM stu(表名);
4.起别名
    AS关键字:可以省略,用空格代替
    SELECT NAME, math, english, math + IFNULL(english, 0) AS 总分(别名) FROM stu;
    SELECT NAME, math 别名, english 别名, math + IFNULL(english, 0) 总分(别名) FROM stu;

3)条件查询

1.where子句后跟条件
2.SQL中的运算符

    >, <, >=, <=, =, <>(不等号,等同于!=)

    BETWEEN...AND
        -- 查询年龄大于等于20,小于等于60的数据
        SELECT * FROM stu WHERE age BETWEEN 20 AND 60;

    IN(集合)
        -- 查询年龄20岁,18岁,25岁的信息
        SELECT * FROM stu WHERE age IN(20, 18, 25);

    LIKE(模糊查询,使用最多)
        占位符:
            _:单个任意字符
                -- 查询姓名第二个字是七的人
                SELECT * FROM stu WHERE NAME LIKE "_七%";

                -- 查询姓名是三个字的人
                SELECT * FROM stu WHERE NAME LIKE "___";

                -- 查询姓名中包含华的人
                SELECT * FROM stu WHERE NAME LIKE "%华%";
            %:多个任意字符
                -- 查询姓王的有哪些
                SELECT * FROM stu WHERE NAME LIKE "王%";

    IS NULL
        -- 查询英语成绩为null
        SELECT * FROM stu WHERE english = NULL; -- 该写法是错误的,因为null值不能使用=或!=判断
        SELECT * FROM stu WHERE english IS NULL;

    and 或 &&
        -- 查询年龄大于等于20,小于等于60的数据
        SELECT * FROM stu WHERE age >= 20 && age <= 60;(不推荐使用&&)
        SELECT * FROM stu WHERE age >= 20 AND age <= 60;(推荐使用AND)
        上述代码可以使用BETWEEN AND优化

    or 或 ||
        -- 查询年龄20岁,18岁,25岁的信息
        SELECT * FROM stu WHERE age = 20 OR age = 18 OR age = 25;
        上述代码可以使用IN优化

    not 或 !
        -- 查询英语成绩不为null
        SELECT * FROM stu WHERE english IS NOT NULL;

4)排序查询

语法:order by 子句

-- 先执行第一个条件,只有当第一个条件一样的时候,再按照第二个条件排序
ORDER BY 排序字段1 排序方式1, 排序字段2 排序方式2;

排序方式:

ASC:升序,默认的。SELECT * FROM stu ORDER BY math [ASC]; -- 不指定排序方式,默认为升序
DESC:降序。SELECT * FROM stu ORDER BY math DESC; -- 降序

注意事项:
如果有多个排序条件,则当前边的条件值一样时,才会判断第二个条件。

5)聚合函数

聚合函数是指将一列数据作为一个整体,进行纵向的计算,计算的结果是一个单行单列的数据。

count:计算个数

1.一般选择非空的列:主键(推荐)
2.COUNT(*)(不推荐)
    *表示即使该列的某个位置是null,但是只要该位置对应行上有其他元素有一个不为null,也可以计算在内
    例如:name age sex english
         张三  18  男  null
         李四  20  女  90
    SELECT COUNT(english) FROM stu; -- 1,但是应该是两个才对
    SELECT COUNT(*) FROM stu; -- 2,虽然english那一列有null,但是name为张三,不是null,所以个数也是计算在内了

max:计算最大值

SELECT MAX(字段名) FROM 表名;

min:计算最小值

SELECT MIN(字段名) FROM 表名;

sum:计算和

SELECT SUM(字段名) FROM 表名;

avg:计算平均值

SELECT AVG(字段名) FROM 表名;

注意:聚合函数的计算,会排出null值。
解决方案:

1.选择非空的列
2.IFNULL函数
   SELECT COUNT(IFNULL(english, 0)) FROM stu;

6)分组查询

语法:GROUP BY 分组字段;

-- 按照性别分组,分别查询男、女同学的平均分
SELECT sex, AVG(math) FROM stu GROUP BY sex;

-- 按照性别分组,分别查询男、女同学的平均分,人数
SELECT sex, AVG(math), COUNT(id) FROM stu GROUP BY sex;

注意:

   1.分组之后查询的字段:分组字段、聚合函数.即
       SELECT 分组字段,聚合函数 FROM 表名 GROUP BY 分组字段;

   2.SELECT后面加其他的字段没有意义,例如:
       SELECT NAME, sex, AVG(math) FROM stu GROUP BY sex;

WHERE 和 HAVING的区别?(【面试题中常考】)

1.WHERE在分组之前进行限定,如果不满足条件,则不参与分组;HAVING在分组之后进行限定,如果不满足条件,则不会被查询出来
2.WHERE后不可以跟聚合函数;HAVING可以进行聚合函数的判断。

分组之前加上条件限制

-- 按照性别分组,分别查询男、女同学的平均分,人数。要求:分数低于85的人,不参与分组
SELECT sex, AVG(math), COUNT(id) FROM stu WHERE math >= 85 GROUP BY sex;

分组之后加上条件限制

-- 按照性别分组,分别查询男、女同学的平均分,人数。要求:分数低于85的人,不参与分组,分组之后,人数要大于2个人
SELECT sex, AVG(math), COUNT(id) FROM stu WHERE math >= 85 GROUP BY sex HAVING COUNT(id) > 2;

-- 给聚合函数COUNT(id)起一个别名,简化书写来参与条件判断
SELECT sex, AVG(math), COUNT(id) total FROM stu WHERE math >= 85 GROUP BY sex HAVING total > 2;

7)分页查询

语法:limit 开始的索引(从0开始), 每页查询的条数;

开始的索引 = (当前的页码 - 1) * 每页显示的条数

-- 一共8条数据,每页显示3条记录
SELECT * FROM stu LIMIT 0, 3;	-- 第一页
SELECT * FROM stu LIMIT 3, 3;	-- 第二页
SELECT * FROM stu LIMIT 6, 3;	-- 第三页

分页操作是一个“方言”,limit只能在MYSQL数据库中使用,其他数据库有其特有的分页方式

2.7 DCL:控制权限、管理用户

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-08-19 19:12:48  更:2022-08-19 19:15:10 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 9:54:11-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码