IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> Python 多进程 -> 正文阅读

[Python知识库]Python 多进程

1、概念

由于Python的GIL,多线程未必是CPU密集型程序的好的选择。

多进程可以完全独立的进程环境中运行程序,可以较充分地利用多处理器。

但是进程本身的隔离带来的数据不共享也是一个问题,而且线程比进程轻量级。

2、multiprocessing.Process

在这里插入图片描述

2.1 进程间同步

Python在进程间同步提供了和线程同步一样的类,使用的方法一样,使用的效果也类似。

不过,进程间代价要高于线程间,而且系统底层实践是不同的,只不过是Python屏蔽了这些不同之处,让用户简单使用多进程。

multiprocessing.Process还提供共享内存、服务器进程来共享数据,还提供了用于进程间通讯的Queue队列/Pipe管道。

进程间的通信方式:
1、多进程就是启动多个解释器进程,进程间通信必须序列化、反序列化
2、数据的线程安全性问题,如果每个进程中没有实现多线程,GIL也就没什么用了。

2.2 示例

# 多进程
# 无法获取函数返回值
# 多进程代码需要放在 __name__ == '__main__' 下面执行

import multiprocessing
import datetime
import logging
import threading
import time

FORMAT = "%(process)8s %(processName)12s %(thread)6d %(message)s"
logging.basicConfig(level=logging.INFO, format=FORMAT)


def clac(i):
    sum = 0
    for _ in range(1000000000):
        sum += 1
        ret = (i, sum)
    logging.info(ret)  # 当前新开进程的主线程
    return ret


if __name__ == '__main__':
    start = datetime.datetime.now()
    ps = []
    for i in range(4):
        p = multiprocessing.Process(target=clac, args=(i,), name='clac-{}'.format(i))
        ps.append(p)
        p.start()

    for p in ps:
        p.join()
        logging.info("{} {} {}".format(p.name, p.exitcode, p.pid))  # 当前运行命令进程的主线程

    delta = (datetime.datetime.now() - start).total_seconds()
    time.sleep(1)
    print(delta)
    print('ps ===>', ps)
    print('end =========================')
    print(threading.currentThread())
   42272       clac-0  12752 (0, 1000000000)
    1400  MainProcess  43224 clac-0 0 42272
   21336       clac-2  48596 (2, 1000000000)
   42048       clac-3  49296 (3, 1000000000)
   45224       clac-1  46380 (1, 1000000000)
    1400  MainProcess  43224 clac-1 0 45224
    1400  MainProcess  43224 clac-2 0 21336
    1400  MainProcess  43224 clac-3 0 42048
47.764683
ps ===> [<Process name='clac-0' pid=42272 parent=1400 stopped exitcode=0>, <Process name='clac-1' pid=45224 parent=1400 stopped exitcode=0>, <Process name='clac-2' pid=21336 parent=1400 stopped exitcode=0>, <Process name='clac-3' pid=42048 parent=1400 stopped exitcode=0>]
end =========================
<_MainThread(MainThread, started 43224)>

Process finished with exit code 0

3、multiprocessing.Pool

multiprocessing.Pool是进程池类。

名称含义
apply(self, func, args=(), kwds={})阻塞执行,导致主进程执行其他子进程就像一个个执行
apply_async(self, func, args=(), kwds={}, callback=None,error_callback=None)与apply方法一致,非阻塞异步执行,得到结果后会执行回调
close()关闭池,池不能再接受新的任务,所有任务完成后退出进程
terminate()立即结束工作进程,不再处理未处理的任务
join()主进程阻塞等待子进程的退出,join()方法要在close或terminate之后使用

3.1 同步调用

# 同步调用
# 多进程的同步阻塞

import multiprocessing
import datetime
import logging

FORMAT = "%(process)8s %(processName)18s %(thread)6d %(message)s"
logging.basicConfig(level=logging.INFO, format=FORMAT)


def clac(i):
    sum = 0
    for _ in range(100000000):
        sum += 1
    logging.info(sum)
    return i, sum  # 进程要return,才可以拿到结果


if __name__ == '__main__':
    start = datetime.datetime.now()
    pool = multiprocessing.Pool(4)
    for i in range(4):
        # 返回值,同步调用,注意观察CPU使用
        ret = pool.apply(clac, args=(i,))  # 同步阻塞函数
        logging.info(ret)
    pool.close()
    pool.join()  # 如果不提前close pool的话,会一直阻塞;因为进程池一直存在

    delta = (datetime.datetime.now() - start).total_seconds()
    logging.info(delta)
    logging.info('end =========================')
   48312  SpawnPoolWorker-1   8216 100000000
   28916        MainProcess   2176 (0, 100000000)
   45884  SpawnPoolWorker-2  38392 100000000
   28916        MainProcess   2176 (1, 100000000)
   50860  SpawnPoolWorker-3  47644 100000000
   28916        MainProcess   2176 (2, 100000000)
   11308  SpawnPoolWorker-4  44452 100000000
   28916        MainProcess   2176 (3, 100000000)
   28916        MainProcess   2176 11.909838
   28916        MainProcess   2176 end =========================

Process finished with exit code 0

3.2 异步调用

# 异步调用
import multiprocessing
import datetime
import logging

FORMAT = "%(process)8s %(processName)18s %(thread)6d %(message)s"
logging.basicConfig(level=logging.INFO, format=FORMAT)


def clac(i):
    sum = 0
    for _ in range(100000000):
        sum += 1
    logging.info(sum)
    return i, sum  # 进程要return,才可以拿到结果


if __name__ == '__main__':
    start = datetime.datetime.now()
    pool = multiprocessing.Pool(4)
    for i in range(4):
        # 注意异步拿到的返回值
        # 异步,非阻塞,需要回调函数才能拿到结果
        # 回调函数是在主进程中的其它线程完成的
        ret = pool.apply_async(clac, args=(i,),
                               callback=lambda ret:logging.info('{} in callback'.format(ret)))
        logging.info('{} ~~~~~~~~~~~~~~'.format(ret))
    # pool.terminate()  # 不等任务完成,直接终止进程池
    pool.close()
    logging.info('*******************************')
    pool.join()

    delta = (datetime.datetime.now() - start).total_seconds()
    logging.info(delta)
    logging.info('end =========================')
   41372        MainProcess  33640 <multiprocessing.pool.ApplyResult object at 0x000001B40CBED9A0> ~~~~~~~~~~~~~~
   41372        MainProcess  33640 <multiprocessing.pool.ApplyResult object at 0x000001B40CD36550> ~~~~~~~~~~~~~~
   41372        MainProcess  33640 <multiprocessing.pool.ApplyResult object at 0x000001B40CD36760> ~~~~~~~~~~~~~~
   41372        MainProcess  33640 <multiprocessing.pool.ApplyResult object at 0x000001B40CD368E0> ~~~~~~~~~~~~~~
   41372        MainProcess  33640 *******************************
   12044  SpawnPoolWorker-2  17296 100000000
   41372        MainProcess  18352 (1, 100000000) in callback
   31700  SpawnPoolWorker-1  46176 100000000
   41372        MainProcess  18352 (0, 100000000) in callback
   46804  SpawnPoolWorker-3   9028 100000000
   41372        MainProcess  18352 (2, 100000000) in callback
   25256  SpawnPoolWorker-4  48704 100000000
   41372        MainProcess  18352 (3, 100000000) in callback
   41372        MainProcess  33640 3.170857
   41372        MainProcess  33640 end =========================

Process finished with exit code 0

4、多线程和多进程的选择

  • CPU密集型:CPython中使用到了GIL,多线程的时候锁互相竞争,且多核优势不能发挥,选用Python多进程效率更高。

  • IO密集型:在Python中适合是用多线程,可以减少多进程间IO的序列化开销,且在IO等待的时候,切换到其他线程继续执行,效率不错。

在这里插入图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-04-23 10:49:32  更:2022-04-23 10:49:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 15:34:53-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码