1. Python基础知识点整理
- 序列(元组、列表)、集合和字典
序列:是一种序列结构,是一种可迭代的、元素有序、可以重复出现的数据结构。 元组:该结构可以进行索引、分片、加和乘的操作。[索引超出范围会发生IndexError的错误]。元组中的元素可以是任何数据类型。【当一个元组只有一个元素时,后面的逗号不能省略。另外可以创建空元祖】。另外,可以使用for循环遍历元组。enumerate函数可以获得元组的对象,该对象由两个元素组成,即索引和数值(i, item)。【元组的值不能修改】【使用小括号表示】 列表:相比于元组,列表具有可变性,可以追加、插入、删除和替换列表中的元素。 【追加单个元素使用append()方法,追加一个列表使用extend()方法】 【remove()方法从左向右查找匹配元素,并删除第一个匹配到的元素】 【pop([i])表示删除索引值为i的元素,i省略时表示删除最后的元素,并返回删除的值】 【使用中括号表示】 集合:是一种可迭代的、无序的、不能包含重复元素的数据结构。【使用大括号表示】 可变集合set:【如果要创建一个空集合不能使用{},否则数据类型为字典】。 一些常用的方法: add():添加元素,如果已经存在则不添加,不会抛出异常。 remove():删除元素,如果不存在则会抛出错误。 discard():删除元素,如果不存在不会抛出异常。 pop():删除返回集合中的任意一个元素,返回值是删除的元素 clear():清空集合 【由于集合是无序的,没有索引,不能通过下标遍历,但是可以采用for循环遍历集合汇中的元素。】 不可变集合frozenset:创建不可变集合不能使用大括号。 字典:是一种可迭代的、可变的数据结构,通过键来访问元素。【使用大括号+键:值的形式表示】 【键不能重复,但是值可以重复】 一些常用的方法: zip():将两个可迭代对象打包成元组 pop(key)(如果不存在返回默认值)和popitem(key)删除键值对。 访问字典的方法: get(key):通过键访问字典,如果不存在返回默认值 items():返回字典所有的键值对 keys():返回字典的所有键视图 values():返回字典的所有值视图 遍历字典:键遍历、值遍历和键值对遍历均可。 - 字符串查找
str.find(sub[, start[, end]])在索引start与end之间查找子字符串sub。如果找到返回值为左端位置的索引,否则返回-1。 str.rfind(sub[, start[, end]])作用同上,区别在于返回值为最右端位置的索引值。 str.count() 方法用于统计字符串里某个字符或子字符串出现的次数。可选参数为在字符串搜索的开始与结束位置。该方法返回子字符串在字符串中出现的次数。 - 正则表达式:实现文本的匹配、查找和替换等操作
正则表达式由普通字符和元字符(Metacharacters)组成。 元字符:用来描述其他字符的特殊字符,由基本元字符和普通字符构成。基本元字符如下表所示: 表1 基本元字符
字符 | 说明 |
---|
\ | 转义符,表示转义 | . | 表示任意一个字符 | + | 表示重复一次或多次 | * | 表示重复零次或多次 | ? | 表示重复零次或一次 | | | 选择符号,表示“或关系” | { } | 定义量词 | [ ] | 定义字符类 | ( ) | 定义分组 | ^ | 表示取反,或匹配一行的开始 | $ | 匹配一行的结束 |
说明:开始与结束字符:^ 和 $ 匹配是要求字符串的开始与结束都要与正则表达式的开始与结束匹配。而不加^ 和 $时,字符串包含正则表达式的匹配内容即可。 字符类:定义一组字符,其中任一字符出现在输入字符串中即匹配成功。注意每次匹配只能匹配字符类中的一个字符。 字符类取反:在正则表达式中指定不想出现的字符,可以使用^符号 量词:匹配显示多次字符或字符串可以使用量词 分组:让一个字符串作为整体使用量词,可将这个字符串放到一对小括号中
-re模块:内置的正则表达式模块 search()方法:在输入字符串中查找,返回第一个匹配内容,如果找到则match对象,否则返回None。 match()方法:在输入字符串开始出查找匹配内容,如果找到一个则match对象,否则返回None。 findall()方法:在输入字符串中查找所有匹配内容,如匹配成功,则返回match列表对象,如匹配失败则返回None finditer()方法:在输入字符串中查找所有匹配内容,如匹配成功,则返回容纳match的可迭代对象,通过迭代对象每次返回一个match对象,匹配失败返回None。 split()方法:按照匹配的字符串进行字符串分割,返回字符串列表对象 sub()方法:用于替换匹配的字符串,返回值是替换后的字符串
- enumerate() 函数:用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中
|