IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 【python学习笔记】字符串常用函数--持续更新 -> 正文阅读

[Python知识库]【python学习笔记】字符串常用函数--持续更新

目录

引言:

len()函数

split()函数

join() 函数

count 方法

find() 方法

index() 方法

字符串大小写转换

删除指定字符

字符串对齐方法

startswith()和endswith()方法

encode()和decode()方法

?dir()和help()帮助函数


引言:

本文主要记录字符串常用函数及例子。

len()函数

作用:要想知道一个字符串有多少个字符(获得字符串长度),或者一个字符串占用多少个字节,可以使用 len 函数。

语法:len(string)

注意:在 Python 中,不同的字符所占的字节数不同,数字、英文字母、小数点、下划线以及空格,各占一个字节,而一个汉字可能占 2~4 个字节,具体占多少个,取决于采用的编码方式。例如,汉字在 GBK/GB2312 编码中占用 2 个字节,而在 UTF-8 编码中一般占用 3 个字节。

以 UTF-8 编码为例,字符串“人生苦短,我用Python!”所占用的字节数如图 1 所示。

?我们可以通过使用 encode() 方法,将字符串进行编码后再获取它的字节数。例如,采用 UTF-8 编码方式,计算“人生苦短,我用Python”的字节数,可以执行如下代码:

例1:
str1 = "人生苦短,我用python!"
len(str1.encode())

结果:
27

注:因为汉字加中文标点符号共 7 个,占 21 个字节,而英文字母和英文的标点符号占 6 个字节,一共占用 27 个字节。

例2:
str1 = "人生苦短,我用python!"
len(str1.encode("gbk"))

结果:
20

注:获取采用 GBK 编码的字符串的长度

split()函数

作用:split() 方法可以实现将一个字符串按照指定的分隔符切分成多个子串,这些子串会被保存到列表中(不包含分隔符),作为方法的返回值反馈回来。

语法:str.split(sep,maxsplit)

--sep:用于指定分隔符,可以包含多个字符。此参数默认为 None;

--maxsplit:可选参数,用于指定分割的次数,最后列表中子串的个数最多为 maxsplit+1。如果不指定或者指定为 -1,则表示分割次数没有限制。

注:在 split ()方法中,如果不指定 sep 参数,那么也不能指定 maxsplit 参数。
????????split() 方法默认采用空字符进行分割,但当字符串中有连续的空格或其他空字符时,都会被视为一个分隔符对字符串进行分割。

join() 函数

作用:是 split() 方法的逆方法,用来将列表(或元组)中包含的多个字符串连接成一个字符串。

语法:newstr = str.join(iterable)

--str:用于指定合并时的分隔符;

--iterable:做合并操作的源字符串数据,允许以列表、元组等形式提供。

例子:
list = ["a","b","c"]
y = ''.join(list)
print(y)
print(type(y))

结果:abc
<class 'str'>
注:分隔符是空字符

count 方法

作用:count 方法用于检索指定字符串在另一字符串中出现的次数,如果检索的字符串不存在,则返回 0,否则返回出现的次数。

语法:str.count(sub[,start[,end]])

--str:表示原字符串;

--sub:表示要检索的字符串;

--start:指定检索的起始位置,默认从头开始检索;

--end:指定检索的终止位置,默认检索到结尾。

find() 方法

作用:检索字符串中是否包含目标字符串,如果包含,则返回第一次出现该字符串的索引;反之,则返回 -1。

语法:str.find(sub[,start[,end]])

--str:表示原字符串;

--sub:表示要检索的字符串;

--start:指定检索的起始位置,默认从头开始检索;

--end:指定检索的终止位置,默认检索到结尾。

注:python还提供了 rfind() 方法,与 find() 方法最大的不同在于,rfind() 是从字符串右边开始检索。

index() 方法

作用:检索是否包含指定的字符串,同 find() 方法类似,不同之处在于,当指定的字符串不存在时,index() 方法会抛出异常。

语法:str.index(sub[,start[,end]])

字符串大小写转换

python的字符串变量提供了 3 种方法,分别是 title()、lower() 和 upper()。

title() 方法

作用:将字符串中每个单词的首字母转为大写,其他字母全部转为小写,转换完成后,此方法会返回转换得到的字符串。如果字符串中没有需要被转换的字符,此方法会将字符串原封不动地返回。语法:str.title()

lower()方法

作用:将字符串中的所有大写字母转换为小写字母,转换完成后,该方法会返回新得到的字符串。如果字符串中原本就都是小写字母,则该方法会返回原字符串。

语法:str.lower()

upper()方法

作用:upper() 的功能和 lower() 方法恰好相反,它用于将字符串中的所有小写字母转换为大写字母,和以上两种方法的返回方式相同,即如果转换成功,则返回新字符串;反之,则返回原字符串。

语法:str.upper()

删除指定字符

字符串变量提供了 3 种方法来删除字符串中多余的空格和特殊字符,它们分别是:

  1. strip():删除字符串前后(左右两侧)的空格或特殊字符。
  2. lstrip():删除字符串前面(左边)的空格或特殊字符。
  3. rstrip():删除字符串后面(右边)的空格或特殊字符。

语法:str.strip([chars])

--[chars] 用来指定要删除的字符,可以同时指定多个,如果不手动指定,则默认会删除空格以及制表符、回车符、换行符等特殊字符。

字符串对齐方法

str 提供了 3 种可用来进行文本对齐的方法,分别是 ljust()、rjust() 和 center() 方法。

ljust() 方法的功能是向指定字符串的右侧填充指定字符,从而达到左对齐文本的目的。

rjust() 方法是向字符串的左侧填充指定字符,从而达到右对齐文本的目的。

center() 字符串方法与 ljust() 和 rjust() 的用法类似,但它让文本居中,而不是左对齐或右对齐。

格式:str.center(width[, fillchar])

startswith()和endswith()方法

startswith()方法

作用:检索字符串是否以指定字符串开头,如果是返回 True;反之返回 False。

语法:

str.startswith(sub[,start[,end]])

--start:指定检索开始的起始位置索引,默认从头开始检索;

--end:指定检索的结束位置索引,默认一直检索在结束。

endswith()方法

endswith() 方法用于检索字符串是否以指定字符串结尾,如果是则返回 True;反之则返回 False。

使用方法同startswith()方法

encode()和decode()方法

最早的字符串编码是 ASCII 编码,它仅仅对 10 个数字、26 个大小写英文字母以及一些特殊字符进行了编码。ASCII 码做多只能表示 256 个符号,每个字符只需要占用 1 个字节。

?GBK 和 GB2312 是我国制定的中文编码标准,规定英文字符母占用 1 个字节,中文字符占用 2 个字节;而 UTF-8 是国际通过的编码格式,它包含了全世界所有国家需要用到的字符,其规定英文字符占用 1 个字节,中文字符占用 3 个字节。

python3.x 默认采用 UTF-8 编码格式,有效地解决了中文乱码的问题。

在 Python 中,有 2 种常用的字符串类型,分别为 str 和 bytes 类型,其中 str 用来表示 Unicode 字符,bytes 用来表示二进制数据。str 类型和 bytes 类型之间就需要使用 encode() 和 decode() 方法进行转换。

encode()方法

encode() 方法为字符串类型(str)提供的方法,用于将 str 类型转换成 bytes 类型,这个过程也称为“编码”。

格式:str.encode([encoding="utf-8"][,errors="strict"])

decode()方法

和 encode() 方法正好相反,decode() 方法用于将 bytes 类型的二进制数据转换为 str 类型,这个过程也称为“解码”。

语法:

bytes.decode([encoding="utf-8"][,errors="strict"])

?dir()和help()帮助函数

dir() 函数用来列出某个类或者某个模块中的全部内容,包括变量、方法、函数和类等,

用法:dir(obj)

--obj 表示要查看的对象。obj 可以不写,此时 dir()?会列出当前范围内的变量、方法和定义的类型。

help() 函数用来查看某个函数或者模块的帮助文档,

用法:help(obj)

obj 表示要查看的对象。obj 可以不写,此时 help() 会进入帮助子程序。

掌握了以上两个函数,我们就可以自行查阅 Python 中所有方法、函数、变量、类的用法和功能了。

最后,如果这篇文章让你有多一点点了解编程这个世界,那就点个赞吧!

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-09-22 14:38:10  更:2021-09-22 14:38:51 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 16:54:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码