第三章 组合数据类型
?本专栏旨在对Python的基础语法进行详解,精炼地总结语法中的重点,详解难点,面向零基础及入门的学习者,通过专栏的学习可以熟练掌握python编程,同时为后续的数据分析,机器学习及深度学习的代码能力打下坚实的基础。
🔥本文已收录于Python基础系列专栏: Python基础系列教程 免费订阅,持续更新。
3.1 列表
3.1.1 列表的表达
- 序列类型:内部元素有位置关系,能通过位置序号访问其中元素
- 列表是一个可以使用多种类型元素,支持元素的增、删、查、改操作的序列类型
ls = ["Python", 1989, True, {"version": 3.7}]
ls
['Python', 1989, True, {'version': 3.7}]
- 另一种产生方式:list(可迭代对象)
- 可迭代对象包括:字符串、元组、集合、range()等
字符串转列表
list("欢迎订阅本专栏")
['欢', '迎', '订', '阅', '本', '专', '栏']
元组转列表
list(("我", "们", "很", "像"))
['我', '们', '很', '像']
集合转列表
list({"李雷", "韩梅梅", "Jim", "Green"})
['Green', 'Jim', '李雷', '韩梅梅']
特殊的range()
for i in [0, 1, 2, 3, 4, 5]:
print(i)
0
1
2
3
4
5
for i in range(6):
print(i)
0
1
2
3
4
5
如果起始数字缺省,默认为0
必须包含中止数字,但是注意中止的数字取不到
数字间隔缺省,默认为1
for i in range(1, 11, 2):
print(i)
1
3
5
7
9
list(range(1, 11, 2))
[1, 3, 5, 7, 9]
3.1.2 列表的性质
ls = [1, 2, 3, 4, 5]
len(ls)
5
变量名[位置编号]
正向索引从0开始 反向索引从-1开始
cars = ["BYD", "BMW", "AUDI", "TOYOTA"]
print(cars[0])
print(cars[-4])
BYD
BYD
变量名[开始位置:结束位置:切片间隔]
cars = ["BYD", "BMW", "AUDI", "TOYOTA"]
print(cars[:3])
['BYD', 'BMW', 'AUDI']
print(cars[1:4:2])
['BMW', 'TOYOTA']
print(cars[:])
['BYD', 'BMW', 'AUDI', 'TOYOTA']
print(cars[-4:-2])
['BYD', 'BMW']
cars = ["BYD", "BMW", "AUDI", "TOYOTA"]
print(cars[:-4:-1])
print(cars[::-1])
['TOYOTA', 'AUDI', 'BMW']
['TOYOTA', 'AUDI', 'BMW', 'BYD']
3.1.3 列表的操作符
- 用**?list1+lis2?**的形式实现列表的拼接
a = [1, 2]
b = [3, 4]
a+b
[1, 2, 3, 4]
- 用?n*list?或?list*n?实现列表的成倍复制
初始化列表的一种方式
[0]*10
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
3.1.4 列表的操作方法
1、增加元素
languages = ["Python", "C++", "R"]
languages.append("Java")
languages
['Python', 'C++', 'R', 'Java']
- 在任意位置插入元素——列表.insert(位置编号,待增元素)
在位置编号相应元素前插入待增元素
languages.insert(1, "C")
languages
['Python', 'C', 'C++', 'R', 'Java']
- 在末尾整体并入另一列表——列表1.extend(列表2)
append 将列表2整体作为一个元素添加到列表1中
languages.append(["Ruby", "PHP"])
languages
['Python', 'C', 'C++', 'R', 'Java', ['Ruby', 'PHP']]
extend 将待列表2内的元素逐个添加到列表1中,当然也可以采用加法实现。
languages = ['Python', 'C', 'C++', 'R', 'Java']
languages.extend(["Ruby", "PHP"])
languages
['Python', 'C', 'C++', 'R', 'Java', 'Ruby', 'PHP']
2、删除元素
languages = ['Python', 'C', 'C++', 'R', 'Java']
languages.pop(1)
languages
['Python', 'C++', 'R', 'Java']
languages.pop()
languages
['Python', 'C++', 'R']
- 删除列表中的第一次出现的待删元素?列表.remove(待删元素)
languages = ['Python', 'C', 'R', 'C', 'Java']
languages.remove("C")
languages
['Python', 'R', 'C', 'Java']
languages = ['Python', 'C', 'R', 'C', 'Java']
while "C" in languages:
languages.remove("C")
languages
['Python', 'R', 'Java']
3、查找元素
- 列表中第一次出现待查元素的位置?列表.index(待查元素)
languages = ['Python', 'C', 'R','Java']
idx = languages.index("R")
idx
2
4、修改元素
- 通过"先索引后赋值"的方式,对元素进行修改?列表名[位置]=新值
languages = ['Python', 'C', 'R','Java']
languages[1] = "C++"
languages
['Python', 'C++', 'R', 'Java']
5、列表的复制
languages = ['Python', 'C', 'R','Java']
languages_2 = languages
print(languages_2)
['Python', 'C', 'R', 'Java']
languages.pop()
print(languages)
print(languages_2)
['Python', 'C', 'R']
['Python', 'C', 'R']
当内容中也有列表这种可变的情况时,这时浅拷贝可能出问题,应该采用深拷贝。
languages = ['Python', 'C', 'R','Java']
languages_2 = languages.copy()
languages.pop()
print(languages)
print(languages_2)
['Python', 'C', 'R']
['Python', 'C', 'R', 'Java']
languages = ['Python', 'C', 'R','Java']
languages_3 = languages[:]
languages.pop()
print(languages)
print(languages_3)
['Python', 'C', 'R']
['Python', 'C', 'R', 'Java']
6、列表的排序
- 使用列表.sort()对列表进行永久排序
- 直接在列表上进行操作,无返回值
- 默认是递增的排序
ls = [2, 5, 2, 8, 19, 3, 7]
ls.sort()
ls
[2, 2, 3, 5, 7, 8, 19]
ls.sort(reverse = True)
ls
[19, 8, 7, 5, 3, 2, 2]
- 使用sorted(列表)对列表进行临时排序
- 原列表保持不变,返回排序后的列表
ls = [2, 5, 2, 8, 19, 3, 7]
ls_2 = sorted(ls)
print(ls)
print(ls_2)
[2, 5, 2, 8, 19, 3, 7]
[19, 8, 7, 5, 3, 2, 2]
sorted(ls, reverse = True)
[19, 8, 7, 5, 3, 2, 2]
7、列表的翻转
- 使用列表.reverse()对列表进行永久翻转
- 直接在列表上进行操作,无返回值
ls = [1, 2, 3, 4, 5]
print(ls[::-1])
ls
[5, 4, 3, 2, 1]
[1, 2, 3, 4, 5]
ls.reverse()
ls
[5, 4, 3, 2, 1]
8、使用for循环对列表进行遍历
ls = [1, 2, 3, 4, 5]
for i in ls:
print(i)
1
2
3
4
5
3.2 元组
3.2.1 元组的表达
- 元组是一个可以使用多种类型元素,一旦定义,内部元素不支持增、删和修改操作的序列类型
通俗的讲,可以将元组视作“不可变的列表”
names = ("Peter", "Pual", "Mary")
3.2.2 元组的操作
- 不支持元素增加、元素删除、元素修改操作
- 其他操作与列表的操作完全一致
3.2.3 元组的常见用处
打包与解包
def f1(x):
return x**2, x**3
print(f1(3))
print(type(f1(3)))
(9, 27)
<class 'tuple'>
a, b = f1(3)
print(a)
print(b)
9
27
numbers = [201901, 201902, 201903]
name = ["小明", "小红", "小强"]
list(zip(numbers,name))
[(201901, '小明'), (201902, '小红'), (201903, '小强')]
for number,name in zip(numbers,name):
print(number, name)
201901 小明
201902 小红
201903 小强
3.3 字典
3.3.1 字典的表达
- 映射类型: 通过“键”-“值”的映射实现数据存储和查找
- 常规的字典是无序的,仅可以通过键来对数据进行访问
students = {201901: '小明', 201902: '小红', 201903: '小强'}
students
字典键的要求
如果重复,前面的键就被覆盖了
students = {201901: '小明', 201901: '小红', 201903: '小强'}
students
{201901: '小红', 201903: '小强'}
-
2、字典的键必须是不可变类型,如果键可变,就找不到对应存储的值了 -
不可变类型:数字、字符串、元组。 ?一旦确定,它自己就是它自己,变了就不是它了。 -
可变类型:列表、字典、集合。? 一旦确定,还可以随意增删改。因此这三个类型不能作为字典的键。
d1 = {1: 3}
d2 = {"s": 3}
d3 = {(1,2,3): 3}
上面没有报错,说明是合法的。
d = {[1, 2]: 3}
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-68-bf7f06622b3f> in <module>
----> 1 d = {[1, 2]: 3}
TypeError: unhashable type: 'list'
d = {{1:2}: 3}
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-69-188e5512b5fe> in <module>
----> 1 d = {{1:2}: 3}
TypeError: unhashable type: 'dict'
d = {{1, 2}: 3}
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-70-c2dfafc1018a> in <module>
----> 1 d = {{1, 2}: 3}
TypeError: unhashable type: 'set'
3.3.2 字典的性质
students = {201901: '小明', 201902: '小红', 201903: '小强'}
len(students)
3
通过?字典[键]?的形式来获取对应的值
students = {201901: '小明', 201902: '小红', 201903: '小强'}
students[201902]
'小红'
3.3.3 字典的操作方法
1、增加键值对
students = {201901: '小明', 201902: '小红', 201903: '小强'}
students[201904] = "小雪"
students
{201901: '小明', 201902: '小红', 201903: '小强', 201904: '小雪'}
2、删除键值对
students = {201901: '小明', 201902: '小红', 201903: '小强'}
del students[201903]
students
{201901: '小明', 201902: '小红'}
students = {201901: '小明', 201902: '小红', 201903: '小强'}
value = students.pop(201903)
print(value)
print(students)
小强
{201901: '小明', 201902: '小红'}
- 变量名.popitem()?随机删除一个键值对,并以元组返回删除键值对
students = {201901: '小明', 201902: '小红', 201903: '小强'}
key, value = students.popitem()
print(key, value)
print(students)
201903 小强
{201901: '小明', 201902: '小红'}
3、修改值
students = {201901: '小明', 201902: '小红', 201903: '小强'}
students[201902] = "小雪"
students
{201901: '小明', 201902: '小雪', 201903: '小强'}
4、d.get( )方法
d.get(key,default)?从字典d中获取键key对应的值,如果没有这个键,则返回default
- 小例子:统计"牛奶奶找刘奶奶买牛奶"中字符的出现频率
s = "牛奶奶找刘奶奶买牛奶"
d = {}
print(d)
for i in s:
d[i] = d.get(i, 0)+1
print(d)
{}
{'牛': 1}
{'牛': 1, '奶': 1}
{'牛': 1, '奶': 2}
{'牛': 1, '奶': 2, '找': 1}
{'牛': 1, '奶': 2, '找': 1, '刘': 1}
{'牛': 1, '奶': 3, '找': 1, '刘': 1}
{'牛': 1, '奶': 4, '找': 1, '刘': 1}
{'牛': 1, '奶': 4, '找': 1, '刘': 1, '买': 1}
{'牛': 2, '奶': 4, '找': 1, '刘': 1, '买': 1}
{'牛': 2, '奶': 5, '找': 1, '刘': 1, '买': 1}
5、d.keys( )?d.values( )方法
把所有的key,value 单独拿出来。
students = {201901: '小明', 201902: '小红', 201903: '小强'}
print(list(students.keys()))
print(list(students.values()))
[201901, 201902, 201903]
['小明', '小红', '小强']
6、d.items( )方法及字典的遍历
print(list(students.items()))
for k, v in students.items():
print(k, v)
[(201901, '小明'), (201902, '小红'), (201903, '小强')]
201901 小明
201902 小红
201903 小强
3.4 集合
3.4.1 集合的表达
- 一系列互不相等元素的无序集合(互斥)
- 元素必须是不可变类型:数字,字符串或元组,可视作字典的键
- 可以看做是没有值,或者值为None的字典
students = {"小明", "小红", "小强", "小明"}
students
{'小强', '小明', '小红'}
3.4.2 集合的运算
Chinese_A = {"刘德华", "张学友", "张曼玉", "钟楚红", "古天乐", "林青霞"}
Chinese_A
{'刘德华', '古天乐', '张学友', '张曼玉', '林青霞', '钟楚红'}
Math_A = {"林青霞", "郭富城", "王祖贤", "刘德华", "张曼玉", "黎明"}
Math_A
{'刘德华', '张曼玉', '林青霞', '王祖贤', '郭富城', '黎明'}
- 语文和数学两门均为A的学员
- S & T 返回一个新集合,包括同时在集合S和T中的元素
Chinese_A & Math_A
{'刘德华', '张曼玉', '林青霞'}
- 语文或数学至少一门为A的学员
- S | T 返回一个新集合,包括集合S和T中的所有元素
Chinese_A | Math_A
{'刘德华', '古天乐', '张学友', '张曼玉', '林青霞', '王祖贤', '郭富城', '钟楚红', '黎明'}
- 语文数学只有一门为A的学员
- S ^ T 返回一个新集合,包括集合S和T中的非共同元素
Chinese_A ^ Math_A
{'古天乐', '张学友', '王祖贤', '郭富城', '钟楚红', '黎明'}
- 语文为A,数学不为A的学员
- S - T 返回一个新集合,包括在集合S但不在集合T中的元素
Chinese_A - Math_A
{'古天乐', '张学友', '钟楚红'}
Math_A - Chinese_A
{'王祖贤', '郭富城', '黎明'}
3.4.3 集合的操作方法
stars = {"刘德华", "张学友", "张曼玉"}
stars.add("王祖贤")
stars
{'刘德华', '张学友', '张曼玉', '王祖贤'}
stars.remove("王祖贤")
stars
{'刘德华', '张学友', '张曼玉'}
len(stars)
3
for star in stars:
print(star)
张学友
张曼玉
刘德华
|