IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Mysql提取表字段中的字符串 -> 正文阅读

[大数据]Mysql提取表字段中的字符串

目录

前言

1. substring_index()字符串提取

2. 其他函数?

2.1 字符串提取

2.2?字符串长度

2.3?使用正则


前言

最新生产上遇到一批订单没有给下游推送数据,为了批量补推数据,需要拿到表中的物流单号(waybillCode字段),但是物流单号放在了notify_data中,因此需要提取表该字段中的物流单号。notify_data字段定义如下:

?字段内容示例如下:

data={"bizType":"COLLECT_STATUS|CHARGE_INFO","collectInfo":{"chargeFee":{"addWeightFee":0,"basicFee":700,"claimFee":850,"declaredFee":0,"insuredFee":0,"majorFee":850,"packageFee":0,"paymentFee":0,"sumFee":850},"collectStatus":"CHARGED","netCode":"551QA","netName":"海德公馆速运营业点"},"common":{"accessKey":"5bBNfCYTFIdwFtxZYSCyiiLryzh08Erv","apiVersion":"2021-02-01","signature":"212b22a1a7212d51b692b6e80e4e50d34bf8cedb357d0f131d91b8f21a98a89b","timestamp":"1646961313","traceId":"b0a5d324d1a94b32989eb906c9b314c5"},"orderId":"LBF00000000007220891082023","waybillCode":"SF1344113109297"}

初步的想法是看看通过SQL能不能直接提取字段内容。

查询资料发现mysql没有split这样的分割函数,这时候我们就会用到另一种函数了,substring_index()。

1. substring_index()字符串提取

substring_index(column_name,split_char,num)

取column_name列以split_char符号为分隔符的前num个字符。
举例:假设table1表column_name列只有一行数据,值为“a-b-c”,通过本函数进行分割,获取(“a”,“b”,“c”)三列。

select SUBSTRING_INDEX(column_name,"-",1),
SUBSTRING_INDEX(SUBSTRING_INDEX(column_name,"-",2),",",-1),
SUBSTRING_INDEX(column_name,"-",-1) from table1

最后的SQL如下:

SELECT
	id,notify_dim_val,notify_data,notify_response,SUBSTRING_INDEX(SUBSTRING_INDEX(SUBSTRING_INDEX(SUBSTRING_INDEX(notify_data,',',-1),':',-1),'"',2),'"',-1)
FROM
	`otms_notify_message` 
WHERE
	id = 33117 
	AND notify_response LIKE '%claimFee is greater than maxClaimAmount%'

查询结果如下图:

2. 其他函数?

2.1 字符串提取

1. substr()与substring()

substr()与substring()目前只涉及到下面两种用法:

substr(data,start)/substring(data,start)
substr(data,start,length)/substring(data,start,length)

由于substr()与substring()的用法是完全一样的,所以下面以substr()进行举例

示例:查找提取某一列数据中最后两个位置的字符
现有一张表table1里面由一列字符串列str1,我们需要找到这个字符串列中每行字符串中最后两个字符的个数。比如某一行字符为“first-str”,那么就提取出tr。

substr(data,start)代码如下:
select substr(str1, -2) from table1
输出:tr

substr(data,start,length)代码如下:
select substr(str1, 2, 2) from table1
输出:ir

?2. left()

left(data,length)

取date的前length个字符。

3.? right()

rigth(data,length)

取date的后length个字符。

4. like()与rlike()
like():不是正则,而是通配符。用到“%”时意思是代表任意多个字符;
rlike():使用的是正则,需要使用转义符,例如匹配“\”时需要使用“\”。

当我们取某字符串类型列"column1"中含有‘a’字符的所有记录时,使用like语句或者rlike语句。

where column1 like '%a%'
where column1 rlike '[a]'

2.2?字符串长度

本节内容都将计算str1:算bilibili00长度

1. length()
获取字符串的占位大小,一个汉字占三个字符,一个数字或字母占一个字符。

length(str1)
输出:
19

2.?char_length()/character_length()

char_length(str1)
character_length(str1)
输出:
13

3. bit_length()
一个汉字或者特殊字符的二进制长度为24,数字或字母的二进制长度为8

bit_length(str1)
输出:
152

2.3?使用正则

首先我们建立一张带有逗号分隔的字符串。

CREATE TABLE test(id int(6) NOT NULL AUTO_INCREMENT,PRIMARY KEY (id),pname VARCHAR(20) NOT NULL,pnum VARCHAR(50) NOT NULL);

然后插入带有逗号分隔的测试数据
INSERT INTO test(pname,pnum) VALUES('产品1','1,2,4');
INSERT INTO test(pname,pnum) VALUES('产品2','2,4,7');
INSERT INTO test(pname,pnum) VALUES('产品3','3,4');
INSERT INTO test(pname,pnum) VALUES('产品4','1,7,8,9');

INSERT INTO test(pname,pnum) VALUES('产品5','33,4');

1. 查找pnum字段中包含3或者9的记录
MySQL> SELECT * FROM test WHERE find_in_set('3',pnum) OR find_in_set('9',pnum);
+----+-------+---------+
| id | pname | pnum??? |
+----+-------+---------+
|? 3 | 产品3 | 3,4???? |
|? 4 | 产品4 | 1,7,8,9 |
+----+-------+---------+
2 rows in set (0.03 sec)

2. 使用正则
mysql> SELECT * FROM test WHERE pnum REGEXP '(3|9)';
+----+-------+---------+
| id | pname | pnum??? |
+----+-------+---------+
|? 3 | 产品3 | 3,4???? |
|? 4 | 产品4 | 1,7,8,9 |
|? 5 | 产品5 | 33,4??? |
+----+-------+---------+
3 rows in set (0.02 sec)
这样会产生多条记录,比如33也被查找出来了。

换一种方式

mysql>?SELECT?*?FROM?test?WHERE?CONCAT(',',pnum,',')?REGEXP?'[^0-9]+[3|9][^0-9]+';??


+----+-------+---------+
| id | pname | pnum??? |
+----+-------+---------+
|? 3 | 产品3 | 3,4???? |
|? 4 | 产品4 | 1,7,8,9 |
+----+-------+---------+
2 rows in set (0.01 sec)

3. select * from oa_student_archives where CONCAT(',',pe_projects,',') like '%,11,%';

这种方式也可以。

注意:

标红的mysql>?SELECT?*?FROM?test?WHERE?CONCAT(',',pnum,',')?REGEXP?'[^0-9]+[3|9][^0-9]+';?

这种,当时小于10的数据搜索是可以的,但是如果是大于10的,则不能用.

总结如下:

1、select * from oa_student_archives where CONCAT(',',pe_projects,',') like '%,11,%';

2、select * from oa_student_archives where?find_in_set('12', pe_projects);

以上的两个都可以用。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-06-29 19:08:56  更:2022-06-29 19:10:17 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 1:36:38-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码