IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> [深度学习 - 目标检测] YOLO系列(六):YOLO-V3源码解析:基于配置文件构造网络模型 -> 正文阅读

[人工智能][深度学习 - 目标检测] YOLO系列(六):YOLO-V3源码解析:基于配置文件构造网络模型

源码:models.py

1. 读取配置文件

  • PyTorch-YOLOv3\config\yolov3.cfg
 def __init__(self, config_path, img_size=416):
        super(Darknet, self).__init__()
        self.module_defs = parse_model_config(config_path)

2. 创建模型

self.hyperparams, self.module_list = create_modules(self.module_defs)

2.1. 读取参数

def create_modules(module_defs):
    """
    Constructs module list of layer blocks from module configuration in module_defs
    """
    hyperparams = module_defs.pop(0)
    output_filters = [int(hyperparams["channels"])]

2.2. 搭建网络结构

按顺序一个模块一个模块的搭建;

 module_list = nn.ModuleList()
 for module_i, module_def in enumerate(module_defs):
        modules = nn.Sequential()

2.2.1. 卷积层

  • PyTorch-YOLOv3\config\yolov3.cfg中,一个[convolutional]是一个数据组合:卷积 + batch normalize + ReLU变形体
[convolutional]
batch_normalize=1
filters=32
size=1
stride=1
pad=1
activation=leaky
  1. 读取convolutional数据;
  2. 做卷积;
  3. batch_normalize
  4. 激活函数, ReLU稍微做了点变形体:nn.LeakyReLU(0.1)
  5. 最后三合一数据组成modules加到一个module_list中;
 if module_def["type"] == "convolutional":
            bn = int(module_def["batch_normalize"])
            filters = int(module_def["filters"])
            kernel_size = int(module_def["size"])
            pad = (kernel_size - 1) // 2
            modules.add_module(
                f"conv_{module_i}",
                nn.Conv2d( # 做 2D的卷积
                    in_channels=output_filters[-1],
                    out_channels=filters,
                    kernel_size=kernel_size,
                    stride=int(module_def["stride"]),
                    padding=pad,
                    bias=not bn,
                ),
            )
            # batch_normalize
            if bn:
                modules.add_module(f"batch_norm_{module_i}", nn.BatchNorm2d(filters, momentum=0.9, eps=1e-5))
            # 激活函数, ReLU稍微做了点变形体:nn.LeakyReLU(0.1);
            if module_def["activation"] == "leaky":
                modules.add_module(f"leaky_{module_i}", nn.LeakyReLU(0.1))
                
     ..............
     ..............
     # Register module list and number of output filters
     module_list.append(modules)

2.2.2. maxpool

V3版本中去掉了这个层;

2.2.3. 上采样upsample

只是定义了一个空层,定义了需要做上采样这件事;

        elif module_def["type"] == "upsample":
            upsample = Upsample(scale_factor=int(module_def["stride"]), mode="nearest")
            modules.add_module(f"upsample_{module_i}", upsample)

2.2.4. route

  • 拼接层;

    配置文件数据:
[route]
layers = -4

layers = -4:跟前面第几层做拼接;

  • 如:当前层-1跟前面第-4层做拼接;

    也只是定义了一个空层,定义了需要做这件事;
 elif module_def["type"] == "route": # 输入1:26*26*256 输入2:26*26*128  输出:26*26*(256+128)
      layers = [int(x) for x in module_def["layers"].split(",")]
      filters = sum([output_filters[1:][i] for i in layers])
      modules.add_module(f"route_{module_i}", EmptyLayer()) 

2.2.5. shortcut

  • 残差链接层;
    配置文件数据:
[shortcut]
from=-3
activation=linear

2.2.6. 核心:yolo层

如下图示,需要构建3个yolo层;

配置文件数据:

[yolo]
mask = 3,4,5
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=80
num=9
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

----

[yolo]
mask = 6,7,8
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=80
num=9
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

---

[yolo]
mask = 0,1,2
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=80
num=9
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1
  1. 读取yolo层数据;
  2. 指定 先验框的id;
  3. 拿到3个先验框实际的大小;
  4. 获取类别,比如一共80个类别(猫、狗…)
  5. 构建 yolo层;
  6. 最后数据组成modules;

      elif module_def["type"] == "yolo":
          # 指定 先验框的id
          anchor_idxs = [int(x) for x in module_def["mask"].split(",")]
          # Extract anchors
          # 拿到3个先验框实际的大小
          anchors = [int(x) for x in module_def["anchors"].split(",")]
          anchors = [(anchors[i], anchors[i + 1]) for i in range(0, len(anchors), 2)]
          anchors = [anchors[i] for i in anchor_idxs]
          # 类别,比如一共80个类别(猫、狗...)
          num_classes = int(module_def["classes"])
          img_size = int(hyperparams["height"])
          # Define detection layer
          # 构建 yolo层
          yolo_layer = YOLOLayer(anchors, num_classes, img_size)
          modules.add_module(f"yolo_{module_i}", yolo_layer)
 # 构建 yolo层
  yolo_layer = YOLOLayer(anchors, num_classes, img_size)
  
  ---
  
# 实现如下:
  
  def __init__(self, anchors, num_classes, img_dim=416):
      super(YOLOLayer, self).__init__()
      self.anchors = anchors
      # 先验框 大小
      self.num_anchors = len(anchors)
      # 先验框 数量
      self.num_classes = num_classes
      # 阈值
      self.ignore_thres = 0.5
      # 损失函数相关
      self.mse_loss = nn.MSELoss()
      self.bce_loss = nn.BCELoss()
      self.obj_scale = 1
      self.noobj_scale = 100
      self.metrics = {}
      self.img_dim = img_dim
      self.grid_size = 0  # grid size
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 00:02:58  更:2022-04-01 00:06:01 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 0:25:31-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码