一 背景
在 Cpython中,由于GIL的存在,所以一次同时只能有一个线程占用CPU,但是即便如此,python 仍然存在线程不安全问题(下文解答), 但是在python中,协程却是安全的
二 详情
import eventlet
import threading
count = 0
def count_10000():
global count
for i in range(100000):
count += 1
def count_in_threads():
threads = []
for i in range(5):
t = threading.Thread(target=count_10000)
threads.append(t)
t.start()
for t in threads:
t.join()
def count_in_coroutines():
pool = eventlet.GreenPool()
for i in range(5):
pool.spawn_n(count_10000)
pool.waitall()
count_in_threads()
print(count) # 多线程执行,返回结果会出现随,并不一定是500000
count = 0
count_in_coroutines() # 多协程执行, 协程安全,一定等于500000
print(count)
首先看下Cpython的中的线程切换模式, 不同线程轮流占用cpu 但是由于线程切换是随机切换的,不能保证加载数据到线程的上下文的时候(未执行计算前),数据是原子操作的, 所以在多线程情况下数据会“不正确”
为什么多协程下数据又是安全的呢?相比多线程切换是系统随机的,协程切换的条件如下:
- sleep:如 eventlet.sleep()
- IO:比如网络 IO,磁盘 IO 等。
所以多协程执行cpu的计算任务 count++ 时候,从读数据到最后写数据都是一次完整的操作,并没有切换协程,也就保证的数据安全
三 总结
python中多协程是安全的,不需要额外的加锁操作来保证数据一致性,同时随便提下,golang中协程能够使用多核CPU,所以使用Chanel(存在互斥锁)等方式保证了数据一致性
四 参考
感谢作者,学到了 协程安全
|