| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 03.初识MNIST数据集 -> 正文阅读 |
|
[人工智能]03.初识MNIST数据集 |
目录 二、不用Deep Learning 用简单的函数映射怎么训练? 1. plot_image(x, y, 'image sample') 一、什么是MNIST数据集? ? ? ? MNIST数据集已经是一个极其经典的数据集了,先放上下载链接MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges 图片是以字节的形式进行存储,我需要将其读取到Numpy array中,以便训练与计算。 数据集大概有 60,000 个训练样本和 10,000 个测试样本。 ? ? ? ? 例举数据集一张图片来说 [0 - 1 , 28 ,28 ] ,存储数据的形式如矩阵所示,第1维度为0-1之间表示灰度,第2维度与第3维度表示28*28格。 二、不用Deep Learning 用简单的函数映射怎么训练?1. 简单函数叠加拟合复杂函数? ? ? ? 我们知道28*28矩阵的具体参数有784个,那么我们将其打平为X = [1,784]向量进行计算,简写为X = [1,dx] ,?接下来将其投入激活函数中进行计算 H1 = XW1 + b1 ,不停拟合(三层)。?这样可能还比较难理解,我们实际代数据进入计算。 首先打平[28*28] 矩阵为X= [1,784], 继续W1=[784,256], b1=[256] 第一层 矩阵H1 = XW1 + b1? 得 H1 = [1,256]? 第二层 矩阵H2 = H1W2?+ b2?,W2为[256?, 64] ,b2 = [64] ,得 H2 = [1,64]? 第三层 矩阵H3 = H2W3?+ b3 ,W3为[64,10], b3 = [10],得H3 = [1,10]? 得出10个分类。 2. Loss函数的设定
Euclidean Distance: H3 vs Y
H3也可以写为预测函数 pred = W3 * {W2[W1X + b1] +b2} +b3 (线性组合)
对于非线性组合还是使用relu函数进行激活拟合
H1 =
relu
(XW1 + b1)
H2 =
relu
(H1W2 + b2)
H3 =
relu
(H2W3 + 3)
𝑝𝑟𝑒𝑑 =
𝑊
3
?
𝑊
2
𝑊
1
𝑋 + 𝑏
1
+ 𝑏
2
+ 𝑏
3
3. 梯度下降
找出使objective最小化的六个参数 W1? W2? W3 b1? b2? b3
4.结果????????对于一个X最终推出其结果为一个1维10列的概率数组:[0.1,? 0.8,? 0.01, 0, 0.02, .........] 取该维度最大的索引下的数字即可?𝑎𝑟𝑔𝑚𝑎𝑥(𝑝𝑟𝑒𝑑) 。 ?三、实例代码1. plot_image(x, y, 'image sample')?2. 训练过程最终的训练精度大约为0.88左右 损失函数的数值如下所示 ?3.代码如下
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 14:22:47- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |