IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 一、深度学习简介 -> 正文阅读

[人工智能]一、深度学习简介

1、什么是神经网络

\qquad 一个关于房价预测的简单神经网络示意图如下图所示:
在这里插入图片描述
\qquad 其中,最左测的所有特征称为输入层(Input layer),中间一层称为全连接层(dense layer),最右侧一层称为输出层(output layer)。

2、使用神经网络做监督学习

\qquad 使用神经网咯做监督学习的使用案例如下所示:
在这里插入图片描述
\qquad 基本神经网络,卷积神经网络(CNN)和循环神经网络(RNN)的示意图如下图所示:
在这里插入图片描述
\qquad 结构化数据: 每一个特征的数据都能都被准确地进行量化,如房价,房间数量;用户年龄,用户ID,etc。
\qquad 非结构化数据: 当输入的信息时声音,图片或者文本时,特征的数据无法准确地进行量化,如图像可以使用像素,文本可以使用单次编码。

3、使用神经网络做逻辑回归

\qquad 加入我们现在的目标是通过二元分类来判断某张图片是否中的图像是否是“猫”,则首先需要将图片的像素值提取出来作为神经网络的输入特征向量,假如一幅图片的大小为64×64个像素点,而每一个像素点又包括红黄蓝三种色彩,将所有的像素点伸缩称为一个特征向量x,则x的大小为64×64×3。
在这里插入图片描述

3.1 符号定义

\qquad 单个样本 ( x , y ) , x ∈ R n , y ∈ { 0 , 1 } (x,y), x \in R^n, y \in \{0,1\} (x,y),xRn,y{0,1},其中x表示特征向量,y表示真值。
\qquad m m m个训练样本: { ( x ( 1 ) , y ( 1 ) ) , ( x ( 2 ) , y ( 2 ) ) , . . . , ( x ( m ) , y ( m ) ) , } \{(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)}), \} {(x(1),y(1)),(x(2),y(2)),...,(x(m),y(m)),}
\qquad 所有特征组成的向量集合 X = [ x ( 1 ) , x ( 2 ) , . . . , x ( m ) ] , X ∈ R ( n × m ) X=[x^{(1)},x^{(2)},...,x^{(m)}], X \in R^{(n × m)} X=[x(1),x(2),...,x(m)],XR(n×m)
\qquad 所有真值的集合 Y = [ y ( 1 ) , y ( 2 ) , . . . , y ( m ) ] Y=[y^{(1)},y^{(2)},...,y^{(m)}] Y=[y(1),y(2),...,y(m)]

3.2 逻辑回归模型

\qquad 给定一组训练数据,需要预测 y ^ = P ( y = 1 ∣ x ) \hat{y}=P(y=1|x) y^?=P(y=1x);给定参数: w ∈ R n , b ∈ R n w \in R^{n}, b \in R^{n} wRn,bRn;输出预测值 y ^ = σ ( w T x + b ) \hat{y}=\sigma(w^Tx+b) y^?=σ(wTx+b)。其中, s i g m o i d = 1 1 + e ? z sigmoid=\frac{1}{1+e^{-z}} sigmoid=1+e?z1?函数图像如下所示:
在这里插入图片描述
\qquad 逻辑回归模型使用交叉熵误差: L ( y ^ , y ) = ? ( y l o g y ^ + ( 1 ? y ) l o g ( 1 ? y ^ ) ) L(\hat{y},y)=-(ylog\hat{y}+(1-y)log(1-\hat{y})) L(y^?,y)=?(ylogy^?+(1?y)log(1?y^?)),使用交叉熵误差的原因如下所示:
在这里插入图片描述
\qquad 逻辑回归的成本函数如下所示: J ( w , b ) = 1 m ∑ i = 1 m L ( y ^ , y ) J(w,b)=\frac{1}{m}\sum_{i=1}^{m}{L(\hat{y},y)} J(w,b)=m1?i=1m?L(y^?,y)

3.3 使用梯度下降训练神经网络

\qquad 神经网络的成本函数是 J ( w , b ) J(w,b) J(w,b),目标是选择合适的参数 w , b w,b w,b使得成本函数 J ( w , b ) J(w,b) J(w,b)尽可能地小,所以使用梯度下降时,首先需要计算 J ( w , b ) J(w,b) J(w,b)关于参数 w , b w,b w,b的偏导数,之后让参数 w , b w,b w,b沿着导数的方向进行移动,直到算法收敛。参数 w , b w,b w,b更新的方式如下所示: w : = w ? α ? J ( w , b ) ? w b : = b ? α ? J ( w , b ) ? b w:=w-\alpha \frac{\partial J(w,b)}{\partial w}\\ b:=b-\alpha \frac{\partial J(w,b)}{\partial b} w:=w?α?w?J(w,b)?b:=b?α?b?J(w,b)?

3.4 计算图

\qquad 计算图从左到右计算损失函数 J J J的值,从右到左计算计算图中每一个参数的梯度,下图是一个计算图的示例:
在这里插入图片描述

3.5 逻辑回归中的梯度下降

\qquad 逻辑回归的模型和计算图如下图所示:
在这里插入图片描述
\qquad 逻辑回归模型反向传播计算过程如下图所示:
在这里插入图片描述

3.6 多样本下的梯度下降

\qquad m个样本下的逻辑回归模型的梯度下降算法流程如下所示:
在这里插入图片描述

THE END

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-19 11:56:10  更:2022-05-19 11:56:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/1 23:47:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码