[人工智能] 开学报告

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 开学报告 -> 正文阅读

[人工智能]开学报告

开学报告 ??本人在暑假期间学习了Python的基础语法，也做了一些与该语言相关的练习题，目前正在学习的课程为DIVE INTO DEEP LEARNING。由于本人之前从未接触过该领域的相关知识，所以决定打好一个牢固的基础。我学习配置了一个环境来运行 Python、Pycharm、相关库以及该课程所需的代码，以快速入门并获得动手学习的经验，并且复习了高等数学和线性代数的相关知识，例如自动求导的代码实现和张量，张量在深度学习中是一个很重要的概念，因为它是一个深度学习框架中的一个核心组件，后续的所有运算和优化算法几乎都是基于张量进行的。

??接着我学习了线性回归模型，线性回归（linear regression）在回归的各种标准工具中最简单而且最流行。线性回归基于几个简单的假设：首先，假设自变量x和因变量y之间的关系是线性的，即y可以表示为x中元素的加权和，这里通常允许包含观测值的一些噪声，其次，我们假设任何噪声都比较正常，如噪声遵循正态分布。为了解释线性回归，我们举一个实际的例子：我们希望根据房屋的面积（平方英尺）和房龄（年）来估算房屋价格（美元）。为了开发一个能预测房价的模型，我们需要收集一个真实的数据集。这个数据集包括了房屋的销售价格、面积和房龄。在机器学习的术语中，该数据集称为训练数据集（training data set）或训练集（training set），每行数据（在这个例子中是与一次房屋交易相对应的数据）称为样本（sample），也可以称为数据点（data point）或数据样本（data instance）。我们要试图预测的目标（在这个例子中是房屋价格）称为标签（label）或目标（target）。预测所依据的自变量（面积和房龄）称为特征（feature）或协变量（covariate）。
??建模时采用线性代数表示法会比较方便。当我们的输入包含d个特征时，我们将预测结果 $\hat{y}$ （通常使用“尖角”符号表示估计值）表示为：
?????????? $\hat{y} = w_{1}x_{1} + ... + w_{d}x_{d} + b$
??当我们的输入包含d个特征时，将所有特征放到向量 $\textbf{x}\in\mathbf{R}^d$ 中，并将所有权重放到向量 $\textbf{w}\in\mathbf{R}^d$ 中， $\hat{y}$ 表示预测结果，可以用点积形式来简洁地表达模型：
?????????? $\hat{y} = \textbf{w}^\top\textbf{x} +b$
扩展：
用符号表示的矩阵 $\mathbf{X}\in\mathbf{R}^{n\times d}$ 可以很方便地引用整个数据集的n个样本。其中， $\mathbf{X}$ 的每一行是一个样本，每一列是一种特征。模型通过矩阵-向量乘法表示为：
?????????? $\hat{y} = \mathbf{X}\mathbf{w} + b$
??给定训练数据特征 $\mathbf{X}$ 和对应的已知标签 $y$ ，线性回归的目标是找到一组权重向量 $w$ 和偏置 $b$ 。当给定从 $\mathbf{X}$ 的同分布中取样的新样本特征时，找到的权重向量和偏置能够使得新样本预测标签的误差尽可能小。
??在训练模型时，我们希望寻找一组参数（ $\mathbf{w}^*,\mathbf{b}^*$ ），这组参数能最小化在所有训练样本上的总损失。如下式：
?????????? $\mathbf{w}^*,\mathbf{b}^* = \argmin_{\mathbf{w},{\mathbf{b}}} ||\mathbf{X} \mathbf{w} - \mathbf{Y}||_2^2（\mathbf{w},\mathbf{b}）$
如何获得 $\mathbf{w}$ ?
推导过程:
$||\mathbf{X} \mathbf{w} - \mathbf{Y}||_2^2 = (\mathbf{X}\mathbf{w}?\mathbf{Y})^{\mathrm{T}}(\mathbf{X}\mathbf{w}?\mathbf{Y})$
??????? $=(\mathbf{w}^{\mathrm{T}}\mathbf{X}^{\mathrm{T}} - \mathbf{Y}^{\mathrm{T}})(\mathbf{X}\mathbf{w}?\mathbf{Y})$
??????? $=\mathbf{w}^{\mathrm{T}}\mathbf{X}^{\mathrm{T}}\mathbf{X}\mathbf{w} - \mathbf{w}^{\mathrm{T}}\mathbf{X}^{\mathrm{T}}\mathbf{Y} - \mathbf{Y}^{\mathrm{T}}\mathbf{X}\mathbf{w} + \mathbf{Y}^{\mathrm{T}}\mathbf{Y}$
将该式关于 $\mathbf{w}$ 求导 (使用向量求导法则) 并令其为 0, 可得
$\mathbf{X}^{\mathrm{T}}\mathbf{X} \mathbf{w} - \mathbf{X}^{\mathrm{T}}\mathbf{Y}$ =0
最后
$\mathbf{w} = (\mathbf{X}^{\mathrm{T}}\mathbf{X})^{-1}\mathbf{X}^{\mathrm{T}}\mathbf{Y}$

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-09-14 13:20:36 更:2021-09-14 13:21:45

360图书馆购物三丰科技阅读网日历万年历 2025年8日历

-2025/8/26 1:47:54-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码