数据驱动的图像分类
数据集图像的构建
在收集数据集之前,我们需要知道对于图像分类,哪些因素会影响计算机对于图像的识别,也就是跨越**“语义鸿沟”**(即如何将我们人类所看到的高层意思转换为计算机所识别的低二进制) 影响计算机对于图像处理的因素
1.视角
对于人来说,从不同的角度看一张图片能很好的识别出是否是同一个物体,而对于机器提取同一物体的不同角度的特征是困难的。
2.光照
在不同的光照条件下,同一物体所呈现出来的样貌有很大的差别,对于计算机进行图像处理有很大的困难。
3.尺寸
在对一个物品进行定性的时候,从不同的尺度对其判断有着不同的差别。
4.遮挡
我们对图像进行处理的时候,很大程度图片上的主要物体的特征展现出来的只有一部分,这就对计算机在进行特征提取时有着很大的影响。
5.形变
与遮挡的不同,物体的形变也是计算机图像识别的一个难题,一个物体由于本身的可变性,在不同环境不同时间所展现出来的状态的不同,计算机在进行图像处理时也具有一定的影响。
6.背景杂波
由于色彩的原因,让物体的背景在一定条件下变成了噪声。
7.类内形变
人类对于一个物体的特性提取是很容易的,比如四条腿,能坐下来的是凳子,但是由于艺术从而产生了各种各样的不同形态的凳子,这就是物体的类内形变。
8.运动模糊
所以说在图像前期的收集,处理等问题可以根据以上方面来进行问题的拆解和解决,从而达到系统性的目的。
分类器设计与学习
分类器作用是在标记好类别的训练数据基础上判断一个新的观察样本所属的类别。
分类器依据学习的方式可以分为非监督学习和监督学习。
非监督学习顾名思义指的是给予分类器学习的样本但没有相对应类别标签,主要是寻找未标记数据中的隐藏结构。
监督学习通过标记的训练数据推断出分类函数,分类函数可以用来将新样本映射到对应的标签。(在监督学习方式中,每个训练样本包括训练样本的特征和相对应的标签。) 监督学习的流程包括:
- 确定训练样本的类型
- 收集训练样本集
- 确定学习函数的输入特征表示
- 确定学习函数的结构和对应的学习算法
- 完成整个训练模块设计
- 评估分类器的正确率
分类器的决策
分类器的决策就是对未知的数据样本进行决策,判断属于哪种类别。
文章参考: 机器学习之分类器的选择 CV之计算机视觉学习
|