[Python知识库] 【数据集处理一】固定间隔抽取图片/标注+重命名

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> 【数据集处理一】固定间隔抽取图片/标注+重命名 -> 正文阅读

[Python知识库]【数据集处理一】固定间隔抽取图片/标注+重命名

数据集一万多张图从视频里来，连续图片相度过高，采用固定间隔选取，提炼出更适合用于目标检测的数据集（之后可以再加上其他场景下的图像对数据集进行扩充）

代码如下：


import os


from shutil import copy

path="D:/Research direction/data set/DL data/VOCdevkit 完整版/VOC2007/Annotations"
out="D:/Research direction/data set/DL data/VOCdevkit 提取版/VOC2007/Annotations"

#获取文件列表
allfilelist=os.listdir(path)  #获取子文件夹名
allfilelist.sort(key=lambda x: int(x[4:]))   #第四个字符以后的字符串转化为数字并进行排序
#print(allfilelist)
#print(len(allfilelist))
index = 1
for file in allfilelist:
    filepath = os.path.join(path, file)
    img_names = os.listdir(filepath)  #获取子文件夹中的文件名
    img_names.sort(key=lambda x: int(x[:-4]))  #倒数第五个字符以前的字符串转化为数字并进行排序
    #print(img_names)
    # 打印文件夹下的数量
    #print(len(img_names))
    #从第一个开始，每隔五个取一个
    img_names=img_names[0::5]
    #print(img_names)
    # 循环读取文件，批操作文件名重命名
    for item in img_names:
            if item.endswith('.xml'):  # 文件格式
                src_path = os.path.join(os.path.abspath(filepath), item)
                dst_path = os.path.join(os.path.abspath(out), '' + str(index) + '.bmp')
                copy(src_path, dst_path)
                index = index + 1

Python知识库最新文章

Python中String模块

【Python】 14-CVS文件操作

python的panda库读写文件

使用Nordic的nrf52840实现蓝牙DFU过程

【Python学习记录】numpy数组用法整理

Python学习笔记

python字符串和列表

python如何从txt文件中解析出有效的数据

Python编程从入门到实践自学/3.1-3.2

python变量

加:2021-10-18 17:21:19 更:2021-10-18 17:22:08

360图书馆购物三丰科技阅读网日历万年历 2025年12日历

-2025/12/29 16:17:15-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码