IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数字图像处理-第一周-理论课 -> 正文阅读

[人工智能]数字图像处理-第一周-理论课

第二章数字图像基础

  • 了解人眼的结构及视觉模型
  • 学习光度学、色度学的基本知识
  • 了解数字图像的获取、采样、量化的基本原理
  • 简单介绍图像存储格式。
  • 了解不同的图像类型的数据特点

1.人眼的结构及视觉模型

视网膜的接收器(感光细胞层)可以分成 两种,分别是锥状体和杆状体

锥状体(cones)─
600~700万,位于中央凹,对颜色高度敏感,可充分分辨图像细节。但只在高照度下提供视觉响应,因此锥状体视觉称为白昼视觉或者亮视觉。

杆状体(rods)─
7500~1500万广泛分布在视网膜表面。 感光能力强于锥状体,能够在低亮度环境反应明暗的信号,提供类似单色的「黑白」视觉,不能区分颜色,细节感知能力不如锥状体。杆状体视觉称为暗视觉或微光视觉。

可见光(visible light)或是物体反射可见光进入人的眼睛,光线由角膜(cornea)的 折射→穿透内部的水样液(aqueous humor)→调整光量的虹膜(Iris)与瞳孔 (pupil)→透过负责调节功能的水晶体(lens)→再汇聚穿透大片的玻璃体液 (vitreous humor)→落入视网膜(retina)上,我们的凝视点落于视网膜上的中央凹 (fovea)及其附近区域。

当晶状体的折射能力由最小变到最大时,晶状体的聚焦中心与视网膜之间的距离
由17mm缩小到14mm。当眼睛聚焦到远于3m的物体时,晶状体的折射能力最弱, 当聚焦到非常近的物体时,其折射能力最强。
在这里插入图片描述
人眼感受亮度与强度是对数关系,同一时刻可以分辨的亮度范围小得多
韦伯比:△Ic照射分量,是背景照明为I时可辨别照明增量的50%,I照射强度,较小的韦伯比意味着有较好的亮度辨别能力
所谓“马赫带效应(Mach band effect)”是指视觉的主观感受在亮度有变化的地方出现虚幻的明亮或黑暗的条纹,马赫带效应的出现是人类的视觉系统造成的。

2.数字图像的获取、采样、量化的基本原理

2.1光和电磁波谱

没有颜色的光称为单色 光或无色光。其唯一属性是光强,或灰度级。
单色图像因为只有灰度级的变换,也称为灰度图像。
发光强度:物理能量
光通量:观察者感受到的光能量
亮度: 光感知的主观描绘。

对于单色图像
L m i n ≤ f ( x , y ) ≤ L m a x L m i n = i m i n r m i n L m a x = i m a x r m a x L_{min}\leq f(x,y)\leq L_{max}\\ L_{min}=i_{min} r_{min}\quad L_{max}=i_{max} r_{max} Lmin?f(x,y)Lmax?Lmin?=imin?rmin?Lmax?=imax?rmax?
0 < i ( x , y ) < ∞ 0<i(x,y)<\infty 0<i(x,y)<入射光强
0 < r < 1 0<r<1 0<r<1反照率
[ L m i n , L m a x ] 灰 度 级 [L_{min},L_{max}]灰度级 [Lmin?,Lmax?]
实际中常常将之线性变换到[0, L -1]
其中0是黑色,L-1是白色。

2.取样和量化的基本概念

空间采样:空间坐标的离散化称为空间采样。 图像的空间分辨率主要由采样决定。
灰度量化:灰度的离散化称为灰度量化。图像的幅度分辨率主要由量化决定。
采样不足可能造成图像粒子变粗,产生方块效应。
量化不足可能造成图像中虚假轮廓。

空间分辨率:单位距离的黑白线条对的数量。lpi 是每英寸的线数。 单位距离的像素的数量。dpi是每英寸的像素数。
1 lpi = 2 dpi
灰度分辨率:灰度级中可分辨的最小变化。基于硬件考虑,通常灰度级为2的整数次幂。 计算机屏幕用8bit量化, 通用的彩色照片每个色彩通道都是8bit的原因。遥感图像的数据常用 16bit量化。

图像的数字表示:假设1幅连续图像f(x,y)等间距采样,获得M行N列
f ( x , y ) = [ f ( 0 , 0 ) f ( 0 , 1 ) ? f ( 0 , ? N ? 1 ) f ( 1 , 0 ) f ( 1 , 1 ) ? f ( 1 , ? N ? 1 ) ? ? ? ? f ( M ? 1 , 0 ) f ( M ? 1 , 1 ) ? f ( M ? 1 , ? N ? 1 ) ] f(x, y)=\left[\begin{array}{cccc} f(0,0) & f(0,1) & \cdots & f(0, \mathrm{~N}-1) \\ f(1,0) & f(1,1) & \cdots & f(1, \mathrm{~N}-1) \\ \vdots & \vdots & \cdots & \vdots \\ f(\mathrm{M}-1,0) & f(\mathrm{M}-1,1) & \cdots & f(\mathrm{M}-1, \mathrm{~N}-1) \end{array}\right] f(x,y)=??????f(0,0)f(1,0)?f(M?1,0)?f(0,1)f(1,1)?f(M?1,1)??????f(0,?N?1)f(1,?N?1)?f(M?1,?N?1)???????
G为离散灰度级数,一般取2的整数幂, G = 2 k G=2^k G=2k ,则存储1幅图像所需的比特(Bit)数为b=M X N X k。例如百万像素1000X1000,256级灰度级图像所用的比特数为八百万。

分辨率与物理尺寸换算
图像分辨率表示为单位长度的点数,它确定了一个像素对应的物理尺寸。
dpi:dot per inch,每英寸的点数
1inch=2.54cm=25.4mm
分辨率仅在涉及到输入输出设备的时候才有意义。例如,扫描仪的分辨率决定了1inch的照片扫描成数字图像后对应的像素数;对像素数已知的数字图像,图像的分辨率决定了打印后在纸上图像的物理尺寸。
d p i = 像 素 数 / 物 理 尺 寸 ( 英 寸 数 ) dpi=像素数/物理尺寸(英寸数) dpi=/

图像内插
讨论图像放大收缩导致的内插,由于其结果改变了分辨率,故又称重采样
最近邻插值法 v ( x , y ) = f ( [ x + 0.5 ] , [ y + 0.5 ] ) v(x,y)=f([x+0.5],[y+0.5]) v(x,y)=f([x+0.5],[y+0.5])
双线性插值法 v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d
三线性插值法 v ( x , y ) = ∑ i = 0 2 ∑ j = 0 3 a i . j x i y j v(x,y)=\sum_{i=0}^2\sum_{j=0}^3a_{i.j}x^{i}y^{j} v(x,y)=i=02?j=03?ai.j?xiyj
在这里插入图片描述

像素间的基本关系
欧氏距离 D E ( p , q ) = ( x p ? x q ) 2 + ( y p ? y q ) 2 D_{E}(p,q)=\sqrt{(x_{p}-x_{q})^2+(y_{p}-y_{q})^2} DE?(p,q)=(xp??xq?)2+(yp??yq?)2 ?相同距离的点近似圆
D4距离或城区距离 D 4 ( p , q ) = ∣ x p ? x q ∣ + ∣ y p ? y q ∣ D_{4}(p,q)=|x_{p}-x_{q}|+|y_{p}-y_{q}| D4?(p,q)=xp??xq?+yp??yq?相同距离的点近似菱形
D8距离或棋盘距离 D 8 = m a x ( ∣ x p ? x q ∣ , ∣ y p ? y q ∣ ) D_{8}=max(|x_{p}-x_{q}|,|y_{p}-y_{q}|) D8?=max(xp??xq?,yp??yq?)相同距离的点近似方形

图像算术操作
逐像素的加减乘除
加操作的去噪效果:
假设 g ( x , y ) g(x,y) g(x,y)是在 f ( x , y ) f(x,y) f(x,y)基础上叠加了一个加性噪声 g ( x , y ) = f ( x , y ) + η ( x , y ) g(x,y)=f(x,y)+\eta(x,y) g(x,y)=f(x,y)+η(x,y)
则叠加K次观测图像后 g ˉ ( x , y ) = 1 K ∑ i = 1 K g i ( x , y ) \bar g(x,y)=\frac{1}{K}\sum_{i=1}^{K}g_{i}(x,y) gˉ?(x,y)=K1?i=1K?gi?(x,y)
其期望为 E g ˉ ( x , y ) = f ( x , y ) E{\bar g(x,y)}=f(x,y) Egˉ?(x,y)=f(x,y)
方差和标准差分别为 σ g ˉ ( x , y ) 2 = 1 K σ η 2 ( x , y ) , σ g ˉ ( x , y ) = 1 K σ η ( x , y ) \sigma^{2}_{\bar g(x,y)}=\frac{1}{K}\sigma^2_{\eta}(x,y),\sigma_{\bar g(x,y)}=\frac{1}{\sqrt{K}}\sigma_{\eta}(x,y) σgˉ?(x,y)2?=K1?ση2?(x,y),σgˉ?(x,y)?=K ?1?ση?(x,y)
标准差随叠加的次数而减小,说明有去噪效果
减操作用于增强差异
使用相乘和相除来校正阴影

数字图像的存储
矢量式-数值图形(Graphics)与分辨率无关,可以任意缩放。文件里有一系列命令和数据,执行这些命令就可以画出图像来。
光栅式-数字图像,位图图像(digital image)由点阵组成,分辨率固定不易缩放,像素间缺少直接表关联的结构

图像格式=元数据(metadata)+图像数据
BMP
JPEG
GIF
TIFF
PSD
PNG
SVG
图像深度:1像素所用的比特数
二值图像 1
灰度图像 8
RGB 24
ABGR 32
CMYK 32

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-29 16:19:21  更:2021-11-29 16:19:23 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 4:02:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码