IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数据增强 | 旋转、平移、缩放、错切、HSV增强 -> 正文阅读

[人工智能]数据增强 | 旋转、平移、缩放、错切、HSV增强


如有错误,恳请指出。


下面简单记录测试了部分数据增强案例,具体原理可以见参考资料,这里不作介绍。

import cv2
import numpy as np
import math

def Img_Show(img):
    cv2.imshow("img", img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

1. 旋转、平移、缩放

img = cv2.imread("./photo/cow.jpg")
h, w = img.shape[0], img.shape[1]
r_img = cv2.warpAffine(src = img,    # 原图像
                        # 仿射变换的旋转矩阵参数
                       M = cv2.getRotationMatrix2D(center=(w // 2, h // 2), angle=-30, scale=0.5),  
                       dsize = (w, h),   # 原尺寸大小(注意这里的顺序是相反的)
                       borderValue = (0, 0, 0))                # 填充值
Img_Show(r_img)

旋转、平移、缩放后图像:
在这里插入图片描述


2. 错切

img = cv2.imread("./photo/cow.jpg")
h, w = img.shape[0], img.shape[1]
angle = 30

# 水平错切
mh = np.eye(3)
mh[0, 1] = np.tan(np.radians(angle))
hh, wh = h, w+h*mh[0, 1]    # 根据三角函数关系对长宽进行补充
imgh = cv2.warpAffine(src = img,            # 原图像
                       M = mh[:2],           # 水平错切
                       dsize = (int(wh), int(hh)),   # 原尺寸大小(注意这里的顺序是相反的)
                       borderValue = (0, 0, 0))      # 填充值
Img_Show(imgh)


# 竖直错切
mv = np.eye(3)
mv[1, 0] = np.tan(np.radians(angle))
hv, wv = h+w*mv[1, 0], w   # 根据三角函数关系对长宽进行补充
imgv = cv2.warpAffine(src = img,            # 原图像
                       M = mv[:2],           # 竖直错切
                       dsize = (int(wv), int(hv)),   # 原尺寸大小(注意这里的顺序是相反的)
                       borderValue = (0, 0, 0))      # 填充值
Img_Show(imgv)


# 同时错切
mb = np.eye(3)
mb[0, 1] = np.tan(np.radians(angle))
mb[1, 0] = np.tan(np.radians(angle))
hb, wb = h+w*mv[1, 0], w+h*mh[0, 1]
imgb = cv2.warpAffine(src = img,            # 原图像
                       M = mb[:2],           # 竖直错切
                       dsize = (int(wb), int(hb)),   # 原尺寸大小(注意这里的顺序是相反的)
                       borderValue = (0, 0, 0))      # 填充值
Img_Show(imgb)

水平错切30°图像:
在这里插入图片描述
竖直错切30°图像:
在这里插入图片描述
两个方向同时错切30°图像:
在这里插入图片描述


3. 随机增强图像HSV

def augment_hsv(img, h_gain=0.5, s_gain=0.5, v_gain=0.5):
    r = np.random.uniform(-1, 1, 3) * [h_gain, s_gain, v_gain] + 1  # random gains
    hue, sat, val = cv2.split(cv2.cvtColor(img, cv2.COLOR_BGR2HSV))
    dtype = img.dtype  # uint8
    
    # 分别针对hue, sat以及val生成对应的Look-Up Table(LUT)查找表
    x = np.arange(0, 256, dtype=np.int16)
    lut_hue = ((x * r[0]) % 180).astype(dtype)
    lut_sat = np.clip(x * r[1], 0, 255).astype(dtype)
    lut_val = np.clip(x * r[2], 0, 255).astype(dtype)
    
    # 使用cv2.LUT方法利用刚刚针对hue, sat以及val生成的Look-Up Table进行变换
    img_hsv = cv2.merge((cv2.LUT(hue, lut_hue), cv2.LUT(sat, lut_sat), cv2.LUT(val, lut_val))).astype(dtype)
    aug_img = cv2.cvtColor(img_hsv, cv2.COLOR_HSV2BGR)
    return aug_img

img = cv2.imread("./photo/cow.jpg")
img_hsv = augment_hsv(img)

Img_Show(img)
Img_Show(img_hsv)

原始图像:
在这里插入图片描述
数据增强后图像:
在这里插入图片描述


参考资料:

  1. 数据增广:旋转,缩放,平移以及错切
  2. HSV模型简介以及利用HSV模型随机增强图像
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-04 12:11:32  更:2022-04-04 12:15:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/8 4:23:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码