| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Python 深度学习 Class 2:神经网络的数学基础 -> 正文阅读 |
|
[人工智能]Python 深度学习 Class 2:神经网络的数学基础 |
目录 2.1 初始神经网络1.加载Mnist数据集
train_images 和train_labels 组成了训练集(training set),模型将从这些数据中进行学习。然后在测试集(test set,即test_images 和test_labels)上对模型进行测试。接下来的工作流程如下:首先,将训练数据(train_images 和train_labels)输入神经网络;其次,网络学习将图像和标签关联在一起;最后,网络对test_images 生成预测,而我们将验证这些预测与test_labels 中的标签是否匹配。 2.网络架构
3.编译步骤
损失函数(loss function):网络如何衡量在训练数据上的性能,即网络如何朝着正确的 在训练和测试过程中需要监控的指标(metric):本例只关心精度,即正确分类的图像所 4.准备图像数据
在开始训练之前,我们将对数据进行预处理,将其变换为网络要求的形状,并缩放到所有值都在[0, 1] 区间。比如,之前训练图像保存在一个uint8 类型的数组中,其形状为(60000, 28, 28),取值区间为[0, 255]。我们需要将其变换为一个float32 数组,其形状为(60000, 28 * 28),取值范围为0~1。 5.准备标签
6.训练网络
2.2 数据表示神经网络数据存储在多维Numpy数组中,也叫张量。 1.标量仅包含一个数字的张量,可以使用ndim查看numpy轴的个数
2.向量数字组成的数组叫做向量或一维张量 3.矩阵向量矩阵的数组叫矩阵或二维张量 4.高维张量多个将矩阵组合成新的数组可以得到3D张量,以此类推,一般处理0D到4D的张量 5.关键属性包括轴的个数(ndim),形状(shape)以及数据类型(dtype) 6.操作张量使用张量切片 7.数据批量深度学习不会同时处理整个数据集,而是将数据拆分成小批量。 8.常用数据张量向量数据:2D张量形状为 (samples, features) 时间序列数据或序列数据:3D 张量,形状为 (samples, timesteps, features)。 图像:4D张量,形状为(samples, height, width, channels)或(samples, channels, 9.时间序列数据当时间(或序列顺序)对于数据很重要时,应该将数据存储在带有时间轴的3D 张量中。 2.3 张量运算keras.layers.Dense(512, activation='relu') output = relu(dot(W, input) + b) 1.逐元素运算relu 运算和加法都是逐元素(element-wise)的运算,即该运算独立地应用于张量中的每 2.广播将两个形状不同的张量相加,若没有歧义的话,较小的张量会被广播(broadcast),以匹配较大张量的形状。 3.张量点积用* 实现逐元素乘积;Numpy 和Keras 中,都是用标准的dot 运算符来实现点积 4.张量变形张量变形是指改变张量的行和列,以得到想要的形状。变形后的张量的元素总个数与初始 5.几何解释? ?6.深度学习的几何解释它将复杂的几何变换逐步分解为一长串基本的几何变换 2.4 梯度优化output = relu(dot(W, input) + b) 在这个表达式中,W 和b 都是张量,均为该层的属性。它们被称为该层的权重(weight)或可训练参数。一开始,这些权重矩阵取较小的随机值,这一步叫作随机初始化,下一步则是根据反馈信号逐渐调节这些权重。这个逐渐调节的过程叫训练。 训练循环: ?梯度优化的训练循环: ?优化器:带动量的SGD、Adagrad、RMSProp |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 23:47:03- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |