IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度学习物体检测实战算法5——视频物体检测 -> 正文阅读

[人工智能]深度学习物体检测实战算法5——视频物体检测

视频检测——获取帧数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

文本框显示

在这里插入图片描述
在这里插入图片描述

显示FPS参数

在这里插入图片描述
在这里插入图片描述

总结

在这里插入图片描述
在这里插入图片描述

"""
配置获取相关预测数据类别,网络参数
获取摄像头视频
获取摄像每帧数据,进行格式形状处理
模型预测、结果NMS过滤
画图:显示物体位置,FPS值(每秒帧数)
"""
from tensorflow.python.keras.preprocessing.image import img_to_array
from tensorflow.python.keras.applications.imagenet_utils import preprocess_input
import numpy as np
import cv2
from nets.ssd_net import SSD300
from utils.ssd_utils import BBoxUtility

class VideoTag(object):
    def __init__(self,model,input_shape,num_classes):
        self.model = model
        self.input_shape = input_shape
        self.num_classes = num_classes
        self.bbox_util = BBoxUtility(num_classes=self.num_classes)
        #创建不同类别20种显示的颜色类型
        self.class_colors=[]
        for i in range(0,self.num_classes):
            hue = 255*i/self.num_classes
            col = np.zeros((1,1,3)).astype("uint8")
            col[0][0][0] = hue
            col[0][0][1] = 128
            col[0][0][2] = 255
            cvcol = cv2.cvtColor(col,cv2.COLOR_HSV2BGR)
            col = (int(cvcol[0][0][0]),int(cvcol[0][0][1]),int(cvcol[0][0][2]))
            self.class_colors.append(col)
    def run(self,file_path,conf_thresh=0.6):
        """
        运行捕捉摄像头,每一帧图片数据,进行预测,标记显示
        :param file_path:
        :return:
        """
        #获取摄像头视频
        cap=cv2.VideoCapture(file_path)
        if not cap.isOpened():
            raise IOError(("打开本视频或者摄像头失败!"))
        #获取摄像每一帧数据,进行格式形状处理
        while True:
            ret,orig_image = cap.read()
            if not ret:
                print("视频检测结束")
                return
            #对每一帧视频中的图片或者摄像头捕捉的图片,进行大小变换(300,300)
            #BGR--->RGB
            source_image = np.copy(orig_image)
            resized=cv2.resize(orig_image,(self.input_shape[0],self.input_shape[1]))
            rgb = cv2.cvtColor(resized,cv2.COLOR_BGR2RGB)
            #保留原市图片数
            to_draw = cv2.resize(resized,(int(source_image.shape[1]),int(source_image.shape[0])))
            #模型预测、结果NMS过滤
            #3维---》4维,preprocess_input
            inputs = [img_to_array(rgb)]
            x = preprocess_input(np.array(inputs))
            y = self.model.predict(x)
            results = self.bbox_util.detection_out(y)
            print(results[0].shape)
            #画图:显示物体位置,FPS值(每秒帧数)
            #画图显示
            if len(results) >0 and len(results[0])>0:
                #获取每个框的位置以及类别概率
                det_label = results[0][:,0]
                det_conf = results[0][:,1]
                det_xmin = results[0][:,2]
                det_ymin = results[0][:,3]
                det_xmax = results[0][:,4]
                det_ymax = results[0][:,5]
                #过滤概率小的
                top_indices = [i for i,conf in enumerate(det_conf) if conf >=conf_thresh]
                top_conf = det_conf[top_indices]
                top_label_indices = det_label[top_indices].tolist()
                top_xmin = det_xmin[top_indices]
                top_ymin = det_ymin[top_indices]
                top_xmax = det_xmax[top_indices]
                top_ymax = det_ymax[top_indices]

                for i in range(top_conf.shape[0]):
                    xmin = int(round(top_xmin[i]*to_draw.shape[1]))
                    ymin = int(round(top_ymin[i]*to_draw.shape[0]))
                    xmax = int(round(top_xmax[i]*to_draw.shape[1]))
                    ymax = int(round(top_ymax[i]*to_draw.shape[0]))
                    class_num = int(top_label_indices[i])
                    print("该帧图片检测到第{}物体,索引为{}".format(i,class_num))
                    #画出这一帧中所有物体框的位置
                    cv2.rectangle(to_draw,(xmin,ymin),(xmax,ymax),self.class_colors[class_num],2)
                    #画出文本框
                    text = self.class_names[class_num]+' '+("%.2f"%(top_conf[i]))
                    #矩形框
                    text_top = (xmin,ymin-10)
                    text_bot = (xmin+80,ymin+5)
                    text_pos = (xmin+5,ymin)
                    cv2.rectangle(to_draw,text_top,text_bot,self.class_colors[class_num],-1)
                    cv2.putText(to_draw,text,text_pos,cv2.FONT_HERSHEY_SIMPLEX,0.35,(255,255,255),1,cv2.LINE_AA)
                    #计算FPS显示
                    fps = "FPS:"+str(cap.get(cv2.CAP_PROP_FPS))
                    #画出FPS
                    cv2.rectangle(to_draw,(0,0),(50,17),(255,255,255),-1)
                    cv2.putText(to_draw,fps,(3,10),cv2.FONT_HERSHEY_SIMPLEX,0.35,(0,0,0),1)
            #显示当前图片
            cv2.imshow("SSD detector result",to_draw)
            if cv2.waitKey(1) & 0xFF == ord('q'):
                break
        #释放资源
        cap.release()
        cv2.destroyWindow()
        return None



if __name__=='__name__':
    input_shape=(300,300,3)
    #数据集的配置
    class_name=[]
    model = SSD300(class_name,num_classes=len(class_name))
    vt = VideoTag(model,input_shape,len(class_name))
    vt.run(0)


  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-19 17:37:57  更:2021-11-19 17:38:33 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 5:43:17-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码