| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【Course 1 神经网络与深度学习】Week 2 神经网络基础 -> 正文阅读 |
|
[人工智能]【Course 1 神经网络与深度学习】Week 2 神经网络基础 |
Neural Network Basics1.Logistic Regression一个用于二分分类(Binary Classification)的算法。 引例:IsCat问题可描述为如下神经网络: 图片在计算机中如何表示?计算机存储了3个独立矩阵,分别对应下图red、green、blue三个颜色通道。 在二分分类问题中,目标是训练出一个分类器。以图片的特征向量x作为输入,输出为预测标签y(0/1)。具体实现如下图: 逻辑回归模型基本概念损失/函数(Loss Function) 是定义在 单个样本上的,算的是单个样本的误差。一般用L表示。用来衡量算法的运行情况,即衡量预测值与实际值有多接近。 具体思路
Sigmoid函数是一种非线性的S型函数,输出被限定在[0,1]之间,通常被用在神经网络中当作激活函数(Activation function)使用。Sigmoid函数的表达式和曲线如下所示: 损失/误差函数(loss/error fuction)和成本/代价函数(Cost Function )的定义:1)虽然用差平方或其1/2这样定义损失函数,理论上是可行的。但在逻辑回归中,我们通常不这样定义,因为原因是这种Loss function一般是non-convex的。non-convex函数在使用梯度下降算法时,容易得到局部最小值(local minumum),即局部最优化。而我们最优化的目标是计算得到全局最优化(Global optimization)。因此,我们一般选择的Loss function应该是convex的。 2)成本/代价函数是损失函数的平均。 基于以上两点,做出如下分析: 2.Gradient Descentw可以是实数,也可以是更高维的向量,为方便理解,以w是实数为例作图如下。我们的目的是用梯度下降法来计算出合适的w和b值,从而最小化m个训练样本的Cost function,即J(w,b)。 由于J(w,b)是convex function,梯度下降算法是先随机选择一组参数w和b值(对于逻辑回归,任意初始化都是有效的,通常用0初始化),然后每次迭代的过程中分别沿着w和b的梯度(偏导数)的反方向前进一小步(沿最陡的下坡方向走),不断修正w和b。每次迭代更新w和b后,都能让J(w,b)更接近全局最小值。梯度下降的过程如下图所示。 3.Forward and Back Propagation整个神经网络的训练过程实际上包含了两个过程:正向传播(Forward Propagation)和反向传播(Back Propagation)。正向传播是从输入到输出,由神经网络计算得到预测输出的过程;反向传播是从输出到输入,对参数w和b计算梯度的过程。 计算图的正向传播计算图的反向传播微积分、链式法则 4. Gradient Descent for Logistic Regression在单个样本上的梯度下降该逻辑回归的正向传播过程如下: 在整体训练集上的梯度下降
5.vectorization在深度学习中,样本数量m通常很大,使用for循环会让神经网络程序运行得很慢。所以,我们应该尽量避免使用for循环操作,而使用矩阵运算,能够大大提高程序运行速度。 向量化:消除代码中显式的for循环 掌握numpy:如dot()、exp()、sum()、zeros() 向量化与非向量化 代码运行时间的比较(以函数dot()为例)
函数sigmoid()的定义:
正向传播一步向量化实现,同时处理m个训练样本: 反向传播
总结6.课后作业 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 16:14:50- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |