IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度学习的实用层面<吴恩达深度学习_第2课_week1> -> 正文阅读

[人工智能]深度学习的实用层面<吴恩达深度学习_第2课_week1>

1. 数据分类

数据一般分为<训练集(train)、验证机(dev)、测试集(test)>
其中,验证集的作用是选择最好的模型,测试集用来评估。

训练集验证集测试集

(1)当数据量较小时(100、1000、1000)

数据一般按照以下比例

训练集验证集测试集
60%20%20%

(2) 当数据量较大时(几十万,百万级)

数据一般按照以下比例

训练集验证集测试集
98%1%1%

或者:

训练集验证集测试集
99.5%0.5%0.1%

2. 方差(variance)和偏差(bias)

(1)区别

方差是预测值自身的一个指标,而偏差是预测值和真实值的一个指标。

(2) 示例

在这里插入图片描述

3. 各种情形的处理方式

在这里插入图片描述

4. 正则化

(1)正则化作用

深度学习可能存在过拟合问题——高方差,有两个解决方法,一个是正则化,另一个是准备更多的数据,这是非常可靠的方法,但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高,但正则化通常有助于避免过拟合或减少你的网络误差。

(2) L 2 L2 L2 正则化

J ( w , b ) = 1 2 ∑ i = 1 m L ( y ^ i , y i ) + λ 2 m ∣ ∣ w ∣ ∣ 2 2 J(w, b) = {1\over2} \sum_{i=1}^m L(\hat{y}^{i}, y^{i}) + {\lambda \over{2m}} ||w||^2_2 J(w,b)=21?i=1m?L(y^?i,yi)+2mλ?w22?
其中:
λ \lambda λ :正则化参数,通常使用验证机来配置这个参数
∣ ∣ w ∣ ∣ 2 2 ||w||^2_2 w22? :欧几里得范数(2范数)的平方,其中:
∣ ∣ w ∣ ∣ 2 2 = ∑ n j = 1 w j 2 = w T w ||w||^2_2= \underset{j=1}{\overset{n}{\sum}} w^2_j=w^Tw w22?=j=1n??wj2?=wTw

5. 神经网络中实现 λ 2 \lambda2 λ2正则化

??神经网络中包含一个成本函数,该函数包含 w [ 1 ] , b [ 1 ] , . . . , w l 1 ] , b [ l ] w^{[1]}, b^{[1]},...,w^{l1]},b^{[l]} w[1],b[1],...,wl1],b[l]所有参数,字母 l l l是神经网络的层数,因此成本函数等于 m m m个训练样本损失函数的总和乘以 1 m 1\over{m} m1?, 正则项为 λ 2 m ∑ L 1 ∣ w [ l ] ∣ 2 {\lambda\over{2m}} \underset{1}{\overset{L}{\sum}}|w^{[l]}|^2 2mλ?1L??w[l]2,我们称之为 ∣ ∣ w [ l ] ∣ ∣ 2 ||w^{[l]}||^2 w[l]2平方范数,这个矩阵范数被定义为矩阵中所有元素的平方求和
J ( w [ 1 ] , b [ 1 ] , . . . , w [ L ] , b [ L ] ) = 1 m ∑ m i = 1 L ( y ^ ( i ) , y ( i ) ) + λ 2 m ∑ L l = 1 ∣ ∣ w [ l ] ∣ ∣ F 2 J(w^{[1]}, b^{[1]},...,w^{[L]}, b^{[L]}) = {1\over{m}} \underset{i=1}{\overset{m}{\sum}}L(\hat{y}^{(i)},y^{(i)}) + {\lambda\over{2m}} \underset{l=1}{\overset{L}{\sum}}||w^{[l]}||^2_F J(w[1],b[1],...,w[L],b[L])=m1?i=1m??L(y^?(i),y(i))+2mλ?l=1L??w[l]F2?
??其中,F: 表示“弗罗贝尼乌斯范数”,用下标 F 标注”,无计算意义;
∣ ∣ w [ l ] ∣ ∣ F 2 = ∑ n [ l ? 1 ] i = 1 ∑ n [ l ] j = 1 ( w i j [ l ] ) 2 ||w^{[l]}||^2_F = \underset{i=1}{\overset{n^{[l-1]}}{\sum}} \underset{j=1}{\overset{n^{[l]}}{\sum}} (w^{[l]}_{ij})^2 w[l]F2?=i=1n[l?1]??j=1n[l]??(wij[l]?)2

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-09 11:39:17  更:2021-12-09 11:40:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 23:55:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码