1.1 可变对象和不可变对象
从一道简单的面试题开始:list 和tuple 区别
在list 集合中可以实现元素的添加、修改、插入、以及删除,由下面的例子可看出并没有要求list 里的每个元素必须是相同的数据类型。
list = [1, 'abc']
print(list)
在tuple 集合中,一旦元素被存储,以后就不能修改,删除了,这比list集合安全许多,所以能用tuple 就用tuple 。
回顾:不可变对象:数字 字符串 元组tuple ;可变对象:字典 列表list 字节数组。
1.2 Python垃圾回收
Python中万物皆对象,在Python中的存储问题也是对象的存储问题。python变量不许指定类型,程序员也无需关心内存管理,因为有Python内存管理器:python内存池 + 垃圾回收机制。
(1)垃圾回收
- 垃圾回收主要以引用计数为主,缺点:不能解决对象的“循环引用”、需要额外空间维护引用计数
引用计数改变的情况:
-
以下四种情况,对象的引用计数+1:
- 对象被创建(a=11)、
- 对象被引用(b=a)、
- 对象被作为参数传到函数中 func(a)、
- 对象作为一个元素存储在容器中(如lst1=[a,a])
-
以下四种情况,对象的引用计数-1:
- 对象的别名被显式销毁 del a、
- 对象的别名被赋予新的对象 a=66、
- 一个对象离开其作用域(如fun函数执行完,
- fun里的局部变量,注意全局变量不会),对象所在的容器被销毁或从容器中删除对象
import sys
def func(c):
print ('in func function',sys.getrefcount(c)-1)
print ('init',sys.getrefcount(11)-1)
a=11
print ('after a=11----',sys.getrefcount(11)-1)
b=a
print ('after b=a----',sys.getrefcount(11)-1)
func(11)
print ('after func(11)----',sys.getrefcount(11)-1)
lst1=[a,12,14]
print ('after lst1=[a,12,14]----',sys.getrefcount(11)-1)
a=666
print ('after a=666----',sys.getrefcount(11)-1)
del a
print ('after del a----',sys.getrefcount(11)-1)
del b
print ('after del b----',sys.getrefcount(11)-1)
del lst1
print ('after del lst1----',sys.getrefcount(11)-1)
结果为
init 50
after a=11---- 51
after b=a---- 52
in func function 54
after func(11)---- 52
after lst1=[a,12,14]---- 53
after a=666---- 52
after del a---- 52
after del b---- 51
after del lst1---- 50
(2)标记-清除 and 分代回收
- 垃圾回收机制以引用机制为主,标记-清除,和分代回收机制为辅的策略:
- 标记-清除机制:用来解决计数引用带来的循环引用而无法释放内存的问题(循环引用只有在容器对象才会产生,如字典、元组、列表等);
- 标记阶段,遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达
- 清除阶段,再次遍历对象,如果发现某个对象没有标记为可达(即为Unreachable),则就将其回收
- 分代回收机制:为提升提升垃圾回收的效率。
1.3 Python内存池
Python内存管理器除了典型的垃圾回收机制,还有Python内存池,下图为CPython(Python解释器)的内存架构图:
- python的对象管理主要位于Level+1~Level+3层
- Level+3层:对于python内置的对象(比如int,dict等)都有独立的私有内存池,对象之间的内存池不共享,即int释放的内存,不会被分配给float使用
- Level+2层:当申请的内存大小小于256KB时,内存分配主要由 Python 对象分配器(Python’s object allocator)实施
- Level+1层:当申请的内存大小大于256KB时,由Python原生的内存分配器进行分配,本质上是调用C标准库中的malloc/realloc等函数
关于释放内存方面,当一个对象的引用计数变为0时,Python就会调用它的析构函数。调用析构函数并不意味着最终一定会调用free来释放内存空间,如果真是这样的话,那频繁地申请、释放内存空间会使Python的执行效率大打折扣。因此在析构时也采用了内存池机制,从内存池申请到的内存会被归还到内存池中,以避免频繁地申请和释放动作。
Reference
[1] https://blog.csdn.net/bjweimengshu/article/details/107624945 [2] Python的内存管理机制:引入计数、垃圾回收、内存池机制
|