| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Lesson 5 Color Image -> 正文阅读 |
|
[人工智能]Lesson 5 Color Image |
一.人类视觉系统(Human Vision System)HVS1.1可见光的物理表示光,据我们高中的物理知识可知具有波粒二象性。而对于与HVS相关的可见光(400nm - 700nm),我们主要关心其波动性。 我们知道可见光(visible light)的能量分布再400nm-700nm之间,据此我们可以绘制功率密度曲线P(f),用以描绘可见光在各个频率上的能量分布情况。P(f)就是可见光的物理表示。 值得注意的是,在上学期的课程中学到过,我们需要将可见光的物理表示和HVS对其的反应区别开。我们可以将HVS视为一个以P(f)为自变量,人类感知(就是你对光的主观感知,记为FEEL)的映射。这个映射具有如下的性质:1.不是一对一映射,即不同的P(f)也可能对应同样的FEEL,称其为“异构同色”现象。? ? ? ?? 1.2 HVS的生理基础和人类颜色感知的合成颜色视觉的三原色理论(Trichromatic theory of colour vision)认为,人对颜色的感知(sensation of color)是由对三种基本的可见光的感知合成的;这三种基本的可见光为short- wavelength的蓝光,medium-wavelength的绿光和long-wavelength的红光。需要注意的是这三种可见光各自对应着spectrum上的一个范围,而不是一个点。 HVS的生理基础是视网膜(retina),对应上述原理,我们认为:1.视网膜上的细胞分为负责感知光强的rods细胞和负则感知颜色的cones细胞,其中cones细胞又分为三种,分别感知红绿蓝三原色。? ? ? ? 2.可以认为rods细胞提供了视觉的全貌(给了灰度图),而cones细胞把灰度图变为color image。 我们的视网膜上的视觉神经元接收到了刺激信号后,需要传递给大脑进行处理。rods提供图像的全貌,三种cones细胞分别提供rgb信息。关于大脑如何处理这四个采集到的信号,有一个对立过程理论(opponent-process theory),认为大脑采集到RGB后,会对RGB进行处理,得到颜色的三个通道: ? ? ? ? 1.亮度通道L =R + G +B; ? ? ? ? 2.S通道: S = G-R; ? ? ? ? 3.T通道:T = B - Y = B - R - G; 所以GR信号互相拮抗,BY信号互相拮抗,我们看不见绿红色和黄蓝色。我们只需要记住这个观点。 1.3 HVS的特点1.人对亮度变化的感知高于对颜色变化的感知,所以量化时亮度信息的量化等级范围要高(而且可以是high resolution),颜色信息的亮化等级范围可以相对低一些(而且可以是low resolution)。这就是JPEG中,对YUV颜色模型下的图片进行不均等保留从而压缩的原理。 2.人对亮度的感知有阈值。 3.颜色和亮度方面细小的变化,HVS不能感知。这个是JPEG频率域滤波滤去高频分量的理论基础。 4.人对绿色的感知要高于蓝色和红色,所以为了是人眼能够察觉图像的更多细节,图像的色调会偏绿。 5.人眼对于光强的感知不是线性的,而是对数的。这表明在量化时,在较暗部分的分辨率可以高些,在较量部分的分辨率可以低些。 二.颜色模型(color model)与颜色空间(color space)2.1颜色模型的定义和分类?这是教师关于颜色模型的定义。颜色的感知是主观的,想要客观地表示颜色(理解为可见光)的话,自然可以使用spectrum或是P(f)。但是这个对于数字系统而言开销较大。所以我们提出不同的颜色模型(color model),并在该模型下表示颜色。颜色模型的提出就是表示颜色的,其可以被视为一个坐标系,其坐标轴可以看作描述颜色的不同维度(坐标系的作用就是通过其几个维度/坐标轴描述点),颜色可以看成坐标系中的点。(当然,这些维度是否足够描述一种颜色我们不深究。我们平时描述一种事物的思想和color model的维度思想是类似。比如描述一个学生,我们会从姓名、性别、年龄、学籍信息、班级和学号这几个维度描述)。 采用的维度(描述的角度)不同,那么color model就不同。总的来讲,我们要学习这些颜色模型。硬件指向的颜色模型是反直觉的,是基于硬件如何描述和产生颜色的;而用户指向的颜色模型是符合直觉的,是基于用户如何感知颜色的。 2.2 RGB颜色模型RGB颜色模型是针对能够主动产生光的设别的颜色模型。所以RGB被称为"three primary colors of light"。严格意义上的RGB光在光谱上对应着一个频率点,规定如下: 严格意义来讲RGB并不能合成任意颜色,除非允许RGB以R0,B0,G0为中心左右略微有些波动。RGB颜色模型是加法模型,是能够主动发光的物体使用的颜色模型。 2.3 CMY(K)颜色模型正如RGB是光的三原色,CMY是染料或说色素的三原色。原因在于色素不能主动发光,我们看到色素的颜色是由色素的反射特定决定的(看色素吸收什么光、反射什么光)。所以CMY显然是减法模型。C为蓝绿色,表示该色素吸收红光,反射蓝、绿光;M为品红色,表示该色素吸收绿光,反射红、蓝光;Y为黄色,表示该色素吸收蓝光,反射红、绿光。 将CMY三种颜色混合,则吸收RGB光,故色素显示黑色(K)。不过目前CMY合成的黑色看起来不是很黑,所以会额外引入K色素(黑色色素)来印刷黑色。 所以,显然CMY(K)颜色模型是用于印刷行业的。 CMY和RGB转换 CMYK和CMY的转换? 2.4 La*b*颜色模型(LUV,YUV均可),YIQ颜色模型L表示亮度,a*和b*是两个颜色分类,用于表示色度(色调和饱和度)。 如果只有L信息的话,那图片变为灰度图了;UV信息的加入使之变成了彩色图片。YUV颜色模型相对于RGB的两个好处是: 1.YUV空间的线性变化在人的感知上也是线性的,而RGB空间中的线性变化在人的感知上却是对数变化的; 2.YUV把颜色信息和亮度信息分开了,而RGB未能做到。 YIQ和YUV颜色模型的道理是一样的,而且作用都是TV transmission。 两者Y一样,UV和IQ的关系是: ? ?2.5 HSV(HSI)颜色模型?HSV颜色模型是最符合人的直观的。H表示色调(hue),S表示颜色的饱和度(saturation),V(value)表示颜色的。这也做到了颜色信息和亮度信息的分离。色度就是颜色的种类(dominant frequency所对于的颜色),value就是颜色的亮度,饱和度就是和白色的混合程度(就是颜色纯不纯,白色是最不纯的颜色)。 ?可以看键,(S,V,H)中V是一个相对值,范围可以设为[0,1];S也一样是个相对值,范围为[0,1]。而H是一个角度。R为0°,G为120°,B为240°。Y为60°,C为180°,M为300°。 三.PGM/PPM images |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 6:32:36- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |