| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【吴恩达Deep Learning】初学者学习记录2 -> 正文阅读 |
|
[人工智能]【吴恩达Deep Learning】初学者学习记录2 |
目录 1.神经网络1)神经网络的概述显而易见 ,神经网络分为三层。输入层,输入特征X(也可以用表示,能向下传递激活值,它是一个四维向量,python中表示为4*1的矩阵)。中间为隐藏层,“隐藏”就是输入到输出中的值,我们在训练中是看不见啊的。最后一层只带有一个节点,这个就是输出层,它负责输出并预测y帽的值(隐藏层维度举例(4,3)前面一个数表示隐藏层节点4,后面的数表示输入层特征3;输出层也有相关的向量维度(1,4)前者为输出层的节点数1,后者为隐藏层的节点数4)。 一般符号的约定是输入层不看作一个标准的层,只记隐藏层和输出层,因此上图的也称之为双层神经网络,第一层也指的是第一层的隐藏层。所以的右上角含义为第0层,即输入层。 2)神经网络的本质?这个图代表了回归计算的两个步骤,而神经网络的本质就是重复这些步骤很多次,所以神经网络的本质是为函数。下面附带如何在python代码中实现定义sigmoid函数:
3)向量化的解释?图中右侧上部为单个样本实现向量化(实现正向传播)的四个公式,需从1到m遍历,下部为多个样本向量化实现的公式(在符号表示中,大写的为多样本的符号,小写为单样本符号)。推导 此图为的吴恩达老师的推导过程,上部的划掉以0作为特殊值方便理解。等号前中的一系列值还需要加上才是真正的值。 ?2.激活函数1)sigmoid函数和tanh函数sigmoid函数的图像在上面,tanh是下面的。但用老师的话tanh函数几乎在所有场合都比sigmoid函数更优越,例外是输出层(使得y帽的值介于0到1之间不是-1到1)和在制作二分类的时候?。 sigmoid函数的导数可以简化为:a'=a(1-a)? ?tanh函数导数:a'=1- 两个函数的缺点:当z值很大或很小的时候,梯度值会接近于零(ReLU函数能很好解决这个问题)。 2)ReLU函数(修正线性单元)和Leaky ReLU函数ReLU函数的公式为a=max(0,z) 在代码运行中z几乎很难达到0。当不确定隐层用什么函数是可以选择ReLU函数。 Leaky ReLU函数 :a=max(0.01z,z) ReLU函数和Leaky ReLU函数可以使,在z=0处,令g'(z)为0.01或1(可以自己设置) 总而言之,当不知道用什么函数的时候,可以都试一试看哪个好。g(z)=z可以用于房地产价值预测 3.神经网络的梯度下降法计算?
其中keepdims = True 的目的是使得b.shape =(4,1)而不是(4,)? 3.代码中的前后向传播根据课堂中所教内容可以在代码中实现以下代码 前向传播:
反向传播:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 19:35:24- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |