字符串的创建与驻留机制
字符串
在python中字符串是基本数据类型,是一个不可变的字符序列
字符串驻留机制
仅保留一份相同且不可变字符串的方法,不同的值被存放在字符串的驻留池中,Python的驻留机制对相同的字符串只保留一份拷贝,后续创建相同字符串时,不会开辟新空间,而是把该字符串的地址赋给新创建的变量
?
驻留机制的几种情况(交互模式)
- 字符串的长度为0或1时
- 符合标识符的字符串(含有字母;数字;下划线的字符串称为标识符字符串)
- 字符串只在编译时进行驻留,而非运行时
- [-5,256]之间的整数数字
- sys中的intern方法强制2个字符串指向同一对象
- PyCharm对字符串进行了优化处理(强制让内容相同的字符串驻留)
字符串驻留机制的优缺点
- 当需要值相同的字符串时,可以直接从字符串池李拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。
- 在需要进行字符串拼接时建议使用str类型的join方法,而非+,因为join()方法时先计算出所有字符串中的长度,然后再拷贝,只new一次对象,效率要比“+”效率高
字符串的常用操作
字符串的查询操作
?
?建议使用find,rfind执行查找操作
字符串大小写转换操作
转换之后将会产生一个新的字符串对象
?
?字符串内容对齐操作
?
?字符串的劈分操作
字符串的判断操作
字符串的替换与合并操作
?
?字符串的比较操作
运算符:>,>=,<,<=,==,!=
比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较
比较原理:两个字符进行比较时,比较的是其ordinal value(原始值),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时,指定ordinal value可以得到其对应的字符
?
?字符串的切片操作
- 字符串是不可变类型
- 不具备增,删,改等操作
- 切片操作将产生新的对象
- 与列表切片操作相同
?格式化字符串
按一定格式输出的字符串叫格式化字符串
?格式化字符串的两种方式
name='张三'
age=20
print('我叫%s,今年%d岁' % (name,age))
print('我叫{0},今年{1}岁'.format(name,age))
print(f'我叫{name},今年{age}岁') #f-string
设置格式化的宽度及浮点型数值的精度
print('%10d' % 99) #10表示的是宽度
print('%.3f' % 3.1415926) #.3表示的是小数点后三位
print('%10.3f' % 3.1415926) #同时表示宽度和精度 总宽度为10,小数点后3位
print('{0:.3}'.format(3.1415926)) #.3表示的是一共是3位数 0代表占位符顺序,可以省略
print('{0:.3f}'.format(3.1415926)) #.3f表示的是3位小数
print('{0:10.3f}'.format(3.1415926)) #同时设置宽度和精度,一共是10位,3位小数
?字符串的编码转换
为什么需要字符串的编码转换
?编码与解码的方式
- 编码:将字符串类型转换为二进制数据(bytes)
- 解码:将bytes类型的数据转换成字符串类型
a='天涯共此时'
#编码
print(a.encode(encoding='GBK')) #在GBK这种编码格式中,一个中文占两个字节
print(a.encode(encoding='UTF-8')) #在UTF-8中,一个中文字符占8个字节
#解码
#byte代表的是一个二进制数据(字节类型的数据)
byte=a.encode(encoding='GBK') #编码
print(byte.decode(encoding='GBK')) #解码
byte=a.encode(encoding='UTF-8')
print(byte.decode(encoding='UTF-8'))
?总结
|