计算机视觉(Computer Vision)技术利用摄像机以及电脑替代人眼对目标进行识别、跟踪、测量和判别决策等,并进一步做图形处理,使电脑处理的信息成为更适合人眼观察或传送给仪器检测的图像。计算机视觉技术是一门包括计算机 科学与工程、神经生理学、物理学、信号处理、认知科学、应用数学与统计等多 学科的综合性科学技术,是人工智能的一个重要分支,目前在智能安防、自动驾 驶汽车、医疗保健、生成制造等领域具有重要的应用价值。 计算机视觉的研究目标是使计算机具备人类的视觉能力,能看懂图像内容、 理解动态场景,期望计算机能自动提取图像、视频等视觉数据中蕴含的层次化语 义概念及多语义概念间的时空关联等。 计算机视觉的研究内容,大体可以分为物体视觉(Object Vision)和空间视 觉(Spatial Vision)两大部分。物体视觉在于对物体进行精细分类和鉴别,而空间视觉在于确定物体的位置和形状,为“动作(action)”服务。正像著名的认知 心理学家 J.J.Gibson 所言,视觉的主要功能在于“适应外界环境,控制自身运动”。 适应外界环境和控制自身运动,是生物生存的需求,这些功能的实现需要靠物体 视觉和空间视觉协调完成。 计算机视觉包括了诸多不同的研究方向,比较基础和热门的方向有物体识别 和检测(Object Detection)、语义分割(Semantic Segmentation)、运动和跟踪 (Motion & Tracking)、视觉问答(Visual Question &Answering)等错误!未找到引用源。。 物体识别和检测,是指对于给定的一张输入图片,算法能够自动找出图片中 的常见物体,并将其所属类别及位置输出出来。衍生出了诸如人脸检测(Face Detection)、车辆检测(Viechle Detection)等细分类的检测算法。
在20世纪10年代,图像识别和分类领域开始从经典的 人工智能技术转向基于机器学习的技术,特别是基于深度学习的技术。从那时起,由于基础技术(算法、 计算硬件和大规模数据集)的不断进步,图像识别已经从一种昂贵的、特定领域的技术转变为一种经济的适用于更多领域的技术,甚至基于视频流识别的技术越来越普遍,几十年来视觉识别算法在智慧城市、智慧工地、智慧社区等安防领域发挥了巨大作用,例如对安全帽的识别、对车辆的识别、对遛狗牵绳的识别逐渐应用广泛,实现了远程的预警预防,减少人力的成本,场景决定算法,算法决定效率,很多垂直领域的系统集成商也在不断探索新的场景,场景的边界不断扩大,笔者前几天在国际安防博览会上有企业提出对电动车电池的识别需求,检测出户主拿电瓶进楼内充电等危险行为,很多楼内着火事件都是给电动车充电造成的,如果能通过此类识别算法解决此类问题,社会治理效率将大大提高,这需要垂直领域的企业和算法厂商共同努力,建立长期合作机制,发挥各自优势,悦保科技是专业的算法提供商,致力于为各行各业提供定制化的算法研发,有专业的团队和AI开放平台,平台开放API接口可快速对接各类系统,帮助客户低成本、高效、安全地使用识别功能。同时,悦保还可提供本地化部署服务,支持客户数据的私有化需求。
|