字符串的创建与驻留机制

字符串

在python中字符串是基本数据类型，是一个不可变的字符序列

字符串驻留机制

仅保留一份相同且不可变字符串的方法，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，而是把该字符串的地址赋给新创建的变量

驻留机制的几种情况(交互模式)

字符串的长度为0或1时
符合标识符的字符串(含有字母;数字;下划线的字符串称为标识符字符串)
字符串只在编译时进行驻留，而非运行时
[-5，256]之间的整数数字
sys中的intern方法强制2个字符串指向同一对象

PyCharm对字符串进行了优化处理（强制让内容相同的字符串驻留）

字符串驻留机制的优缺点

当需要值相同的字符串时，可以直接从字符串池李拿来使用，避免频繁的创建和销毁，提升效率和节约内存，因此拼接字符串和修改字符串是会比较影响性能的。
在需要进行字符串拼接时建议使用str类型的join方法，而非+，因为join()方法时先计算出所有字符串中的长度，然后再拷贝，只new一次对象，效率要比“+”效率高

字符串的常用操作

字符串的查询操作

?建议使用find，rfind执行查找操作

字符串大小写转换操作

转换之后将会产生一个新的字符串对象

?字符串内容对齐操作

?字符串的劈分操作

字符串的判断操作

字符串的替换与合并操作

?字符串的比较操作

运算符：>,>=,<,<=,==,!=

比较规则：首先比较两个字符串中的第一个字符，如果相等则继续比较下一个字符，依次比较下去，直到两个字符串中的字符不相等时，其比较结果就是两个字符串的比较结果，两个字符串中的所有后续字符将不再被比较

比较原理：两个字符进行比较时，比较的是其ordinal value（原始值），调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr，调用内置函数chr时，指定ordinal value可以得到其对应的字符

?字符串的切片操作

字符串是不可变类型
不具备增，删，改等操作
切片操作将产生新的对象
与列表切片操作相同

?格式化字符串

按一定格式输出的字符串叫格式化字符串

?格式化字符串的两种方式

name='张三'
age=20
print('我叫%s，今年%d岁' % (name,age))

print('我叫{0}，今年{1}岁'.format(name,age))

print(f'我叫{name}，今年{age}岁') #f-string

设置格式化的宽度及浮点型数值的精度

print('%10d' % 99) #10表示的是宽度
print('%.3f' % 3.1415926) #.3表示的是小数点后三位
print('%10.3f' % 3.1415926) #同时表示宽度和精度 总宽度为10，小数点后3位

print('{0:.3}'.format(3.1415926)) #.3表示的是一共是3位数 0代表占位符顺序，可以省略

print('{0:.3f}'.format(3.1415926)) #.3f表示的是3位小数

print('{0:10.3f}'.format(3.1415926)) #同时设置宽度和精度，一共是10位，3位小数

?字符串的编码转换

为什么需要字符串的编码转换

?编码与解码的方式

编码：将字符串类型转换为二进制数据（bytes）
解码：将bytes类型的数据转换成字符串类型

a='天涯共此时'
#编码
print(a.encode(encoding='GBK')) #在GBK这种编码格式中，一个中文占两个字节
print(a.encode(encoding='UTF-8')) #在UTF-8中，一个中文字符占8个字节

#解码
#byte代表的是一个二进制数据（字节类型的数据）
byte=a.encode(encoding='GBK') #编码
print(byte.decode(encoding='GBK')) #解码

byte=a.encode(encoding='UTF-8')
print(byte.decode(encoding='UTF-8'))