[Python知识库] python的多线程和yield

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> python的多线程和yield -> 正文阅读

[Python知识库]python的多线程和yield

拉取、入库的优化点：

请求接口：
- 场景：原来一次请求一个月的数据，可能会面临接口卡顿的问题，而且数据量过大，有时候会溢出
- 解决：可以考虑由一次请求 切分为 小而多次请求
  - 加个for循环，分为小批量去请求，避免接口数据量过大
  - 将多次请求采用多线程进行，避免单线程I/O阻塞（可以异步操作，可以先发送请求而不等待结果返回）
```
    
    with futures.ThreadPoolExecutor() as executor: # 可传入线程数
            # 传入执行的方法 和 参数列表，会等待所有线程执行完毕
            query_info_list = list(executor.map(self.api.get_pipeline_info,query_list)) 
```
- 注意点：
  - 接口性能：需要接口方面也支持并发处理，不然你这边同时发送多个请求，接口方还是一个一个给你处理，时间上并无提升
  - 风险与收益并存：在这过程发生了错误，会比较难处理，不能第一时间捕捉，而且可能会一错毁所有
  - 限定场景：网上有传言python的多线程只用到了一个CPU核心，由于对python底层暂不了解，所以盲猜这里的多线程操作只适用于I/0密集的场景

数据入库：

场景：入库时候可能会一次性插入上万条大数据，数据库和本地内存会承受较大压力

解决：可以采用python yield关键字，把数据分片处理

使用举例：

def chunk_request():
    for xxx in 一堆数据:
		yield xxx    # 1. 先返回一个结果

def chunk(iterator, bulk_size=50):
# 2. 会等待，凑满50个yield的结果，然后统一返回
    """
    工具方法, 返回一批结果的迭代器
    """
    for item in iterator:
        yield chain([item], islice(iterator, bulk_size - 1))

for items in chunk(self.chunk_request(start=start, end=end)):  # 3. 收满50个yield为一组
    # 进行小批量入库操作 
    # obj.create(xxx)

对于yield自己的理解：有点像协程的概念，平时我们一个return，方法就直接结束，返回结果了，但是使用了yield就很好玩了，你可以先返回一个结果，然后再回到上次返回结果的地方，继续往下执行。所以利用这个特性，我们就可以将数据给分片处理了，先返回一小部分结果，然后入库，再返回执行，拿到下一批结果，再入库，而不是一次return一大堆数据。

升级版本: 不仅做到控制数据小批量入库，还可以控制到源头数据小批量拉取（利用上边讲的特性，会返回方法里继续往下执行代码）

# 拉取:
for 一次拉取 in  多次调用api拉取:
    	yield 数据   # 这样可以做到先返回数据，再回来执行for循环 继续往下调用api拉取
        
# 入库:
for 数据 in chunk(一小批数据):
       入库

Python知识库最新文章

Python中String模块

【Python】 14-CVS文件操作

python的panda库读写文件

使用Nordic的nrf52840实现蓝牙DFU过程

【Python学习记录】numpy数组用法整理

Python学习笔记

python字符串和列表

python如何从txt文件中解析出有效的数据

Python编程从入门到实践自学/3.1-3.2

python变量

加:2021-07-24 11:23:48 更:2021-07-24 11:25:56

360图书馆购物三丰科技阅读网日历万年历 2025年9日历

-2025/9/26 16:53:47-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码