| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 图像的数字表示 -> 正文阅读 |
|
[人工智能]图像的数字表示 |
目录 1.人类视觉感知的基础知识1.1概述????????计算机视觉系统在很多时候根据人类视觉感知系统建立。如果我们想教会机器像人类一样观察和分析看到的世界,那么有必要了解人类视觉感知系统是如何工作的。图像是如何在眼睛中形成的?人类从视觉信号中提取哪种类型的信息?人类视觉系统有哪些物理缺陷? ????????人类的视觉系统可以在复杂的环境中分别人和其他物体。我们可以很轻易的提取关于物体尺寸大小相对位置距离等信息。我们的大脑擅长根据物体的一部分补充其完整。 ????????我们对物体的想象不是根据物体的实际细节,我们的感知是有歧义的和主观的,他依靠所谓的“视觉经验”。下面有几个例子: 1、我们如何看见-物体的易变性 比如下图,在日常灯的形式多样,不同的大小不同的形状,但是我们可以很轻松的一眼认出它。 2、我们如何看见-感知的歧义 ? ? ? ? 下幅画可以看成一个女人的脸或者萨克斯管? 3、关于视觉感知的事实 ? ? ? ? a、大脑总是会对图片补充,或者赋予图片语意 ? ? ? ? b、大脑总是回以常见的方式补充图片 ? ? ? ? c、我们“看”世界的方式总是取决于成长的环境 1.2 眼睛构造和工作机制参考:人眼视觉特性_qq60068ddbd1678的技术博客_51CTO博客 ????????视觉感知始于物体或场景反射的光线通过角膜、瞳孔和晶状体进入到我们的眼睛。角膜和晶状体帮助将这些光线集中并投射到位于眼球后部视网膜的感光层上。晶状体的另一个功能是通过必要的调节让视线的焦点放在不同距离的物体上。进入角膜的光线量由位于角膜和晶状体之间由虹膜分隔的瞳孔收放来控制。视网膜负责将不同波长(颜色)、对比度和亮度的光线进行解析为生理信号。该信号通过视神经和神经通路被传递到大脑的视觉信息处理区域。 ? ? ? ? 亮度(视觉适应)和分辨率 1、人类视觉系统能够适宜很大的亮度值大约是10^10;感知的亮度是实际亮度的对数函数;在低亮度环境下,存在存在过度过程。 2、虽然人类视觉系统可以适宜很大范围的亮度,但是它不能同时在这个范围内工作,存在一个调节过程,它通过改变整体灵敏度来适应整个范围,这个过程叫做亮度适应。在给定的外部条件下,系统的灵敏度水平叫做亮度适应水平;如下图,在适应水平Ba点视觉系统的感知范围是否有限当亮度小于Bb点时,视觉主观感知就时黑暗,直线的虚线部分没有限制,但是随着时间增加系统回逐渐适应 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 图.暗适应曲线(dark-adaptation curve)???????? 3、亮度区分能力 4、马赫带 2.颜色????????我们谈到了亮度以及人类如何感知亮度。现在让我们转向颜色。什么是颜色?我们的视觉系统如何识别不同的颜色?与亮度一样,我们感知的颜色不仅仅取决于照明和物体的物理特性。严格来说,我们感知到的颜色是光波和光波相互作用的结果。我们的视觉系统。 2.1频谱????????虽然人脑对颜色的感知和解释过程代表对一种心理生理现象的不完整研究,颜色的物理性质早在1666年就可以准确描述。艾萨克·牛顿爵士发现,当一束阳光穿过玻璃棱镜时,发出的光线不是白色,而是由连续的光谱组成,从一端的紫色到另一端的红色:感知为可见光,是电磁辐射光谱的一小部分。这一频谱的一端是无线电波。电磁波可以被解释为以波长A传播的正弦振荡,或者被解释为以光速移动的零质量粒子流。每个这样的粒子都没有质量,但具有一定的能量,被称为辐射量子或光子。光子能量与辐射频率成正比,即较高频率(即较短波长)的电磁振荡具有更多的光子能量。因此,无线电波的光子能量低,微波的光子能量多,红外辐射的光子能量更多,然后光子能量依次增加,可见光谱、紫外线、X射线,最后是能量最高的伽马射线。 2.2光反射????????颜色是由光反射所产生的,这种反射是由物体的物理性质决定的,如光的吸收、发射光谱等。例如红色的物体主要反射波长在625-740nn之间的电磁波。 2.3颜色感知但人对颜色的感觉不仅仅由光的物理性质所决定,还包含心理等许多因素,比如人类对颜色的感觉往往受到周围颜色的影响。有时人们也将物质产生不同颜色的物理特性直接称为颜色。人眼中的视锥细胞和视杆细胞都能感受颜色,一般人眼中有三种不同的视锥细胞:第一种主要感受黄绿色,它的最敏感点在565纳米左右;第二种主要感受绿色,它的最敏感点在535纳米左右;第三种主要感受蓝紫色,其最敏感点在420纳米左右[1][2]。视杆细胞只有一种,它的最敏感的颜色波长在蓝色和绿色之间。每种视锥细胞的敏感曲线大致是钟形的,视锥细胞依照感应波长不同由长到短分为L、M、S三种。因此进入眼睛的光一般相应这三种视锥细胞和视杆细胞被分为4个不同强度的信号。 2.4 原色和次要颜色????????原色:它们是纯色,即红色,蓝色和黄色。次要颜色:它们是两种原色的结合,例如:绿色(蓝色和黄色),橙色(黄色和红色)和紫色(红色和蓝色)。第三色:它们是原色和第二色的并集,例如:橙红色,红紫色,黄橙色,绿蓝色,黄绿色。发光的媒体(比如电视机)使用红、绿 和蓝加色的三元色,每种光尽可能只刺激针对它们的锥状细胞而不刺激其它的锥状细胞。这个系统的色域占人可以感受到的色彩空间的大部分,因此电视机和电脑萤幕使用这个系统。理论上我们也可以使用其他颜色作为元色,但使用红、绿和蓝我们可以最大地达到人的色彩空间。遗憾的是对于红、绿和蓝色没有固定的波长的定义,因此不同的技术仪器可能使用不同的波长从而在萤幕上产生稍微不同的颜色。 3 图像的数字形式3.1计算机如何看见图像????????为了形成数字图像,需要通过采样和量化将来自传感器的连续模拟信号转换为数字形式。我们先来看单色图像。原始模拟图像在x和y坐标以及亮度级别上是连续的。为了将此函数转换为数字形式,有必要用坐标和亮度级别来表示它。以有限读数集的形式表示坐标称为离散化,以来自有限集的值表示亮度级别称为量化。作为离散化和量化操作的结果,出现了实数矩阵。这种用于以某种形式表示图像的格式被组合为位图(栅格图)。矩阵的每个元素对应一个图像像素。元素的值对应于相应像素的亮度或强度级别。强度值通常在0到1的范围内进行归一化。通过这种归一化,白色像素的值为1,黑色像素的值为0。 3.2位图的参数????????离散化是决定图像空间分辨率的主要因素。本质上,空间分辨率是图像中最小细节的大小。空间分辨率是根据每个空间单位的像素数来衡量的。标准度量单位是ррi,即每英寸像素。图像的尺寸与其分辨率密切相关。图像的分辨率越高,可以在屏幕上打印或显示的图像就越大,而不会出现任何明显的质量损失。 3.3色深????????根据位深度,可将位图分为1、4、8、16、24及32位图像等。每个像素使用的信息位数越多,可用的颜色就越多,颜色表现就越逼真,相应的数据量越大。例如,位深度为 1 的像素位图只有两个可能的值(黑色和白色),所以又称为二值位图。位深度为 8 的图像有 28(即 256)个可能的值。位深度为 8 的灰度模式图像有 256 个可能的灰色值。 3.4 ?明度,色相,饱和度????????色彩的三要素是指每一种色彩都同时具有三种基本属性,即明度、色相和纯度。色彩的饱和度和明度的是我们色彩设计中最近常使用的两个变量,我们先来了解一下它的定义: 饱和度:指颜色的纯度或强度,简单点理解就是颜色中的灰色量含量的高低。 明度:指的是颜色中混合了多少白色或黑色。 3.5 1931 CIE-XYZ颜色系统????????X、Y、Z是三原色,是为了避免CIE-RGB系统中的三刺激值和色度坐标值出现负值而虚构出来的三原色,实际上是不存在的。作为三原色的红色X、绿色Y、蓝色Z转化为观察者感知的颜色如下图: 其中: 小写x代表红色的比例 小写 y代表绿色的比例 小写 z代表蓝色的比例 x+y+z=1 3.6 CIE1931色度图????????光谱的红色波段在图的右下角,绿色波段在左上角,蓝色波段在左下角。形成一个马蹄形,马蹄形边上各点代表380nm(紫色)到780nm(红色)之间所有的纯色光。 3.7色域?????????如果你在色度图上选择了任何两点,则位于这两点之间直线上任何颜色都可以用这两个颜色混合出来。这得出了色域的形状必定是凸形的。混合三个光源形成的所有颜色都可以在色度图内的源点形成的三角形内找到(对于多个光源也如是)。 4.颜色模型参看 数字图像处理(2): 颜色空间/模型—— RGB, CMY/CMYK, HSI, HSV, YUV_TechArtisan6的博客-CSDN博客_rgb分别是什么颜色 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 15:25:00- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |