IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度学习--损失函数 -> 正文阅读

[人工智能]深度学习--损失函数


损失函数是表示深究网络性能的“恶劣程度”的指标,即当前的神经网络对监督数据在多大程度上拟合,在多大程度上是不一致

均方差

E = 1 / 2 ∑ k ( y k ? t k ) 2 E = 1/2\sum_{k}(y_k - t_k)^2 E=1/2k?(yk??tk?)2
yk表示神经网络的输出,tk表示监督数据,k表示数据的维度

y = [0.1,0.05,0.6,0.0,0.05,0.1,0.0,0.1,0.0,0.0]#softmax函数的输出值
t = [0,0,1,0,0,0,0,0,0,0,0]#正确的解是1,其他为0

数组元的索引从第一个开始依次对应的数字“0”,“1”,“2”,…。这里的y是神经网络的输出ysoftmax函数的输出。上述的列子可以表达“0”的概率是0.1,“1”的概率是0.05,“2”的概率是0.6。t是监督数据,将正确解的标签是1,其他的均为0
代码实现:

def mean_squared_error(y,t):
	return 0.5 * np.sum(y-t)**2

交叉熵误差

E = ? ∑ k ( t k l o g y k ) E = -\sum_{k}(t_k logy_k) E=?k?(tk?logyk?)
这里的log表示以e为底的自然对数(loge)
代码实现:

def cross_entropy_error(y,t):
	dalta = le-7#表示10的-7次方
	return -np.sum(t * np.log(y+delta))

这里加上一个微小值delta,是因为np.log(0)时,会出现np.log(0)为负无穷大-inf,导致后面的结果无法运行

mini-batch

神经网络的学习是通过从训练集中选出一批数据(称为mini-batch,小批量),然后在对每一个mini-batch进行学习。比如,从60000个训练数据中随机选择100笔,在对100笔数据进行学习。

mini-batch版交叉熵误差

改良一下之前实现对应单数据的交叉熵误差。

def cross_entropy_error(y,t):
    if y.ndim == 1:
        t = t.reshape(1,t.size)
        y = y.reshape(1,y.size)
        
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + le-7)) / batch_size

此外当监督数据是标签形式(非one-hot表示,而是像“2”,“7”这样的标签时),使用下面代码实现

def cross_entropy_error(y,t):
    if y.ndim == 1:
        t = t.reshape(1,t.size)
        y = y.reshape(1,y.size)
        
    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size),t]+le-7) / batch_size
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-03 11:10:51  更:2021-08-03 11:14:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 15:21:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码