IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Mysql 去除重复数据和去除同名列(distinct、group by、using()) -> 正文阅读

[大数据]Mysql 去除重复数据和去除同名列(distinct、group by、using())

感觉网上很多表述都有些问题,网上很多讲述“列去重”的意思都说把当前的列重复的数据去重,但是还有一种情况是关联表查询后出现大量重复同名列的情况,假如对这种列的结果进行嵌套查询,就有可能报Duplicate column name 'XXX'的错误,或者指代不明Column 'XXX' in field list is ambiguous的错误。

假如有这样两张表(仅供参考,不代表有实际数据库设计)

ta
stu_idstu_nameorg_idclass_idsub_idscore
1001张三1231140188
1002李四1231240178
1003王五1231140197
1004陆六3211140165
1001张三1231140287
1002李四1231240293
1003王五1231140299
1004陆六3211140389
tb
tea_idtea_nameorg_idclass_idsub_id
2001乔治12311401
2001乔治12312401
2002佩奇12312402
2002佩奇32111401
2003吉吉12312401
2003吉吉32111403

一.去重同一列的重复数据

1.distinct

需求:找出tb中org_id的种类

分析:单表查询并去重相同的org_id值

select distinct(org_id) from tb

查询结果:

org_id
123
321

2.group by

需求:查询学生总分

分析:单表查询,分组统计成绩

select stu_id,stu_name,sum(score)?from ta group by stu_id,stu_name

查询结果

stu_idstu_namesum
1001张三175
1002李四171
1003王五196
1004陆六154

错误示例:不分组会出现数据重复显示

select stu_id,stu_name,sum(score)?from ta
stu_idstu_namesum
1001张三175
1002李四171
1003王五196
1004陆六154
1001张三175
1002李四171
1003王五196
1004陆六154

3.其他常用的方法还有row_number over(),LIMIT 等,本人用得比较少,可以自行了解。

二,重复的同名列

一般出现在合并表查询中

需求:找出乔治教的学生和老师所有信息

分析:找出乔治任教班级和科目,关联学生表

select * from ta inner join tb on ta.class_id =tb.class_id where tea_name = '乔治'

查询结果:

可以看到查询的结果是有重复的同名列,当然在查询的时候,会把后面的同名列自动重命名

分析:那么我们如果想把进行关联的同名列合并显示,可以改用USING()来代替ON,来去重

select * from ta inner join tb using(class_id) where tea_name = '乔治'

查询结果:

stu_idstu_nameorg_idclass_idsub_idscoretea_idtea_nameorg_id(1)
1001张三12311401882001乔治123
1002李四12312401782001乔治123
1003王五12311401972001乔治123

可以看到没有关联的org_id还是会自动重命名。

问题来了,如果要进行嵌套查询,比如(实际意义的例子暂时没想到,容我这样举例。。)

select class_id?from (select * from ta inner join tb using(class_id) where tea_name = '乔治') tc

就会出现?Duplicate column name 'org_id'这种错误

原因是sql在合并表重命名第二个同名列实际上还是存成org_id,只是呈现出来不一样。所以方法有几个:

1.对第二个org_id进行人为重命名

2.把org_id纳入到using()中,保证查询结果只有一个org_id

3.select出想要的字段,避免重名列干扰

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-17 22:14:33  更:2022-03-17 22:17:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 6:49:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码