开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 吴恩达《神经网络和深度学习》学习笔记——（一）神经网络的编程基础 -> 正文阅读

[人工智能]吴恩达《神经网络和深度学习》学习笔记——（一）神经网络的编程基础

第二周：神经网络的编程基础(Basics of Neural Network programming)

文章目录

第二周：神经网络的编程基础(Basics of Neural Network programming)
前言
正文
总结

前言

主要内容：吴恩达《Deep Learning》系列的第一门课《神经网络和深度学习》的第二周部分：神经网络的编程基础

简介：本文是笔者在学习该课程的过程中随意记录的一些要点，希望能帮助到大家，欢迎大家留言or私信讨论
参考资料：吴恩达先生的课程材料&黄海广先生整理的深度学习课程笔记(V5.7)

正文

以下是本篇文章正文内容

2.1 二分类(Binary Classification)

eg.一张 $64 ? 64$ 的图维度 $n_x=64*64*3=12288$ ，特征向量为[ $n_x$ ,1]维度列向量
在这里插入图片描述

2.2 逻辑回归 (Logistic Regression)

该算法适用于二分类问题

$\widehat{y}=\sigma (w^Tx+b)$

其中

$\widehat{y}$ 为y等于1的可能性或者机会

w为特征权重

b为偏差

$\sigma$ 图像如下所示， $z=w^Tx+b$ ， $\sigma (z)=\frac{1}{1+e^{-z}}$ ，其中z为实数

2.3 逻辑回归的代价函数（ Logistic Regression Cost Function）

Why need 代价函数

? 对于每个训练样本，我们使用这些带有圆括号的上标来区分索引和样本，训练样本 𝑖所对应的预测值是 $𝑦^{(𝑖)}$ ,是用训练样本的 $𝑤^T𝑥^{(𝑖)}+𝑏$ 然后通过 sigmoid函数来得到。

? 上标 (𝑖)来指明数据表示 𝑥或者 𝑦或者 𝑧或者其他数据的第 𝑖个训练样本。

损失函数

? Loss function： $L(\widehat{y},y)$

? 我们通过这个𝐿称为的损失函数，来衡量预测输出值和实际值有多接近。

? 我们在逻辑回归中用到的损失函数是： $L(\widehat{y},y)=-ylog(\widehat{y})-(1-y)log(1-\widehat{y})$

代价函数

? $J(w,b)=\frac{1}{m}\sum_{i=1}^mL(\widehat{y}^{(i)},y^{(i)})$

? 损失函数只适用于像这样的单个训练样本，而代价函数是参数的总代价，所以在训练逻辑回归模型时候，我们需要找到合适的 𝑤和 𝑏，来让代价函数 𝐽 的总代价降到最低。

? 逻辑回归可以看做是一个非常小的神经网络

2.4 梯度下降法（ Gradient Descent）

? 梯度下降法的形象化说明

2.5 导数（ Derivatives）

2.6 更多的导数例子（ More Derivative Examples）

2.7 计算图（ Computation Graph）

? 计算图组织计算的形式是用蓝色箭头从左到右的计算，反向红色箭头 (也就是从右到左 )的导数计算

2.8 使用计算图求导数（Derivatives with a Computation Graph）

2.9 逻辑回归中的梯度下降（ Logistic Regression Gradient Descent）

2.10 m 个样本的梯度下降 (Gradient Descent on m Examples)

2.11 向量化 (Vectorization)

2.12 向量化的更多例子（ More Examples of Vectorization）

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LQoJ5Jjn-1628088187450)(C:\Users\14566\AppData\Roaming\Typora\typora-user-images\image-20210708181220111.png)]$

2.13 向量化逻辑回归 (Vectorizing Logistic Regression)

$Z=[z^{(1)},z^{(2)},...,z^{(n)}]$ 其中 $z=w^Tx+b$

2.14 向量化 logistic 回归的梯度输出（ Vectorizing Logistic Regression’s Gradient）

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Bb3MJSNy-1628088187452)(C:\Users\14566\AppData\Roaming\Typora\typora-user-images\image-20210708184030738.png)]$