前言:
利用python解决问题的过程中,经常会遇到从某个对象中抽取部分值的情况。“切片”操作正是专门用于实现这一目标的有力武器。理论上,只要条件表达式得当,可以通过单次或多次切片操作实现任意目标值切取。切片操作的基本语法比较简单,但如果不彻底搞清楚内在逻辑,也极容易产生错误,而且这种错误有时隐蔽得较深,难以察觉。本文通过详细例子总结归纳了切片操作的各种情形,下文均以list类型作为实验对象,其结论可推广至其他可切片对象。
一、 什么是切片
切片(slice)就是一种截取索引片段的技术,借助切片技术,我们可以十分灵活地处理序列类型的对象。
包括:正索和负索引两部分,
如下图所示,以list对象list = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
二、 切片操作的一般方式
一个完整的切片表达式包含两个“:”,用于分隔三个参数(start_pos、end_pos、step)。
当只有一个“:”时,默认第三个参数step=1;
当一个“:”也没有时,start_pos=end_pos,表示切取start_pos指定的那个元素。
切片操作基本表达式:str_object[start_pos:end_pos:step]
start_pos:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。
end_pos:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。
step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍!
三、 切片例子
以下示例均以list对象list = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
print(list)
1. 提取单个元素
print(list[0])
print(list[-4])
2. 提取完整对象
print(list[:])
print(list[::])
print(list[::-1])
3. start_pos和end_pos全为正(+)索引的情况
print(list[1:6]
print(list[1:6:-1])
print(list[6:2])
print(list[:6])
print(list[:6:-1])
print(list[6:])
print(list[6::-1])
4. start_pos和end_pos全为负(-)索引的情况
print(list[-1:-6])
索引-1在-6的右边(如上图)
print(list[-1:-6:-1])
索引-1在6的右边(如上图)
print(list[-6:-1])
print(list[:-6])
print(list[:-6:-1])
print(list[-6:])
print(list[-6::-1])
5. start_pos和end_pos正(+)负(-)混合索引的情况
print(list[1:-6])
print(list[1:-6:-1])
print(list[-1:6])
print(list[-1:6:-1])
6. 多层切片操作
print(list[:8][2:5][-1:])
print(list[:8])
print(list[:8][2:5])
print(list[:8][2:5][-1:])
7. 切片操作的三个参数可以用表达式
print(list[2+1:3*2:7%3])
8. 其他对象的切片操作
前面的切片操作以list对象为例进行说明,但实际上可进行切片操作的数据类型还有很多,包括元组、字符串等等。
list = (0, 1, 2, 3, 4, 5)[:3]
print(list)
list = 'ABCDEFG'[::2]
for i in range(1,100)[2::3][-5:]:
print(i)
四、 常用切片操作
1.取偶数位置
print(list[::2])
2.取奇数位置
print(list[1::2])
3.拷贝整个对象
b = list[:]
print(b)
print(id(a))
print(id(b))
b = a.copy()
print(b)
print(id(a))
print(id(b))
需要注意的是:[:]和.copy()都属于“浅拷贝”,只拷贝最外层元素,内层嵌套元素则通过引用方式共享,而非独立分配内存,如果需要彻底拷贝则需采用“深拷贝”方式,如下例所示:
a = [1,2,['A','B']]
print('a={}'.format(a))
b = a[:]
b[0] = 9
b[2][0] = 'D'
print('a={}'.format(a))
print('b={}'.format(b))
print('id(a)={}'.format(id(a)))
print('id(b)={}'.format(id(b)))
a=[1, 2, ['A', 'B']]
a=[1, 2, ['D', 'B']]
b=[9, 2, ['D', 'B']]
id(a)=38669128
id(b)=38669192
4.修改单个元素
list[3] = ['A','B']
print(list)
5.在某个位置插入元素
list[3:3] = ['A','B','C']
print(list)
list[0:0] = ['A','B']
print(list)
6.替换一部分元素
list[3:6] = ['A','B']
print(list)
五、 总结
(一)start_pos、end_pos、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,即:当start_pos表示的实际位置在end_pos的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_pos表示的实际位置在end_pos的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
(二)当start_pos或end_pos省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
(三)step的正负是必须要考虑的,尤其是当step省略时。比如a[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但实际上a[-1:]=[9](注意不是9),原因在于step省略时step=1表示从左往右取值,而起始索引start_pos=-1本身就是对象的最右边元素了,再往右已经没数据了,因此结果只含有9一个元素。
(四)需要注意:“取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如上面的a[0]=0、a[-4]=6,元素0和6都是“数值型”,而母对象a却是“list”型;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如上面的a[-1:]=[9],返回的是一个只包含元素“9”的list,而非数值型“9”。
|