IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 网络协议 -> 字符串提取两个关键字中间的所有字符 -> 正文阅读

[网络协议]字符串提取两个关键字中间的所有字符

背景

? ? ? ? 在做一个淘宝的商品信息收集是用到了,说多了要被屏蔽,直接给代码吧

目的

? ? ? ? 我有一堆字符串关键字1***************关键字2 我想提取出来两个关键字中间的内容 ,比如 "p4pTags"XXXXXXXXXXXX"icon"这种

代码

import re

pattern=re.compile(r"关键字1(.*?)关键字1",re.S)
response_list = re.findall(pattern,待分割字符串)[0]

举例

import re

res = '"p4pTags":300,"price":588,"icon"'
pattern=re.compile(r'"p4pTags"(.*?)"icon"',re.S)
response_list = re.findall(pattern,res)[0]

结果

response_list:
:300,"price":588,

一点解释

? ? ? ? re.S 的目的是指定将带匹配的字符串看成一个字符串,这样就能处理中间含有\n这种换行符存在的情况, 如果不指定,默认一行一行的匹配,你可能匹配出来是None

不足的点

? ? ? ? 也是我踩的坑,就是两个关键字相同的情况,不太高的定,她执照得到一半。举个例子:关键字******待提取1*********关键字******待提取2*********关键字******待提取3*********关键字,用这种方法不行只会得到******待提取1***************待提取3*********

实例如下

import re

a= "mmkkjklmmkkuiommkkpoimmkkouymmkkll"
p=re.compile(r"mmkk(.*?)mmkk")
b=re.findall(p,a)

结果是

b=['jkl', 'poi']

解决不足

那怎么解决呢?答用字符串分割,代码如下

import re

a= "mmkkjklmmkkuiommkkpoimmkkouymmkkll"
p=re.compile(r"mmkk(.*?)mmkk")
b=re.findall(p,a)
c=a.split('mmkk')

此时结果是

b=['jkl', 'poi']
c= ['', 'jkl', 'uio', 'poi', 'ouy', 'll']

只要去掉开头和结尾就是我们想要的,即

ans = c[1:-1]

得到我们感兴趣的所有子字符串

ans= ['jkl', 'uio', 'poi', 'ouy']
  网络协议 最新文章
使用Easyswoole 搭建简单的Websoket服务
常见的数据通信方式有哪些?
Openssl 1024bit RSA算法---公私钥获取和处
HTTPS协议的密钥交换流程
《小白WEB安全入门》03. 漏洞篇
HttpRunner4.x 安装与使用
2021-07-04
手写RPC学习笔记
K8S高可用版本部署
mySQL计算IP地址范围
上一篇文章      下一篇文章      查看所有文章
加:2022-02-26 12:07:35  更:2022-02-26 12:08:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年10日历 -2024/10/5 13:21:52-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码