[大数据] innot inexistsnot exists使用方法和区别

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> innot inexistsnot exists使用方法和区别 -> 正文阅读

[大数据]innot inexistsnot exists使用方法和区别

select a.* from A a where exists(select 1 from B b where a.id=b.id);

select a.* from A a where not exists(select 1 from B b where a.id=b.id);

select * from A where id in(select id from B);

select * from A where id not in(select id from B);

对于以上两种查询条件，in是把外表和内表作hash 连接，而exists 是对外表作loop 循环，每次loop 循环再对内表进行查询。
exists,not exists后跟的是一个true或者是false
in和exists区别
in在查询的时候，确定给定的值是否与子查询或列表中的值相匹配。首先查询子查询的表，然后将从表和主表做一个笛卡尔积，然后按照条件进行筛选。所以相对从表比较小的时候，in的速度较快。
exists是指定一个子查询，检测行的存在。遍历循环外表，然后看外表中的记录有没有和内表的数据一样的。匹配上就将结果放入结果集中。
举例说明效率问题
A表有10000条记录，B表有1000000条记录，那么使用in最多可能有10000 * 1000000次遍历；
A表有10000条记录，B表有100条记录，那么使用in最多可能有10000 * 100次遍历；
in()适合B表数据量小于A表数据量的情况

A表有10000条记录，B表有10000000条记录，那么exists()会执行10000次去判断A表中的id是否与B表中的id相等。
如：A表有10000条记录，B表有10000000000条记录，那么exists()还是执行10000次，可见B表数据越多，越适合exists()发挥效果。
再如：A表有10000条记录，B表有100条记录，那么exists()还是执行10000次，还不如使用in()遍历10000 * 100次，因为in()是在内存里遍历比较，而exists()需要查询数据库，我们都知道查询数据库所消耗的性能更高，而内存很快，所以exists()适合B表数据量大于A表数据量情况
数据量相差不大的情况下，采用exists要比in效率高，因为IN不走索引（全表扫描）

数据从一个表往另外一个表中插入数据时使用EXISTS:
在插入记录前，需要检查这条记录是否已经存在，只有当记录不存在时才执行插入操作，可以通过使用 EXISTS 条件句防止插入重复记录。
insert into A (name,age) select name,age from B where not exists (select 1 from A where A.id=B.id);

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2022-03-30 18:32:03 更:2022-03-30 18:36:19

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/13 16:28:09-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码