| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习1 -> 正文阅读 |
|
[人工智能]机器学习1 |
? ? ? ? 本文简单介绍一下机器学习的三要素(以监督学习为例)。机器学习方法都是由模型、策略和算法构成,即机器学习方法由三要素构成,可以简单地表示成: ? ? ? ? ????????????????????????方法 = 模型 + 策略 + 算法 1.模型? ? ? ? 机器学习首先要考虑的问题是学习什么样的模型。在监督学习中,模型就是所要学习的条件概率发布或决策函数。简单地理解:模型本质上就是一个函数,其作用就是实现从一个样本X到样本的标记值Y的一个映射,即 g:X->Y?.下面来详细地阐述什么是模型。 ? ? ? ? 输入空间 X 和输出空间 Y 构成了一个样本空间。对于样本空间中的样本(x,y)∈(X,Y),假定存在一个未知的真实映函数 g: X->Y ,使得? ? ? ? ? ? ? ? ? 机器学习的目标是找到一个模型来近似真实映射函数 ? ? ? ? 由于我们不知道真实的 ? ? ? ? 假设空间 ???????????????????????? ? ? ? ? ? ? ? ? 其中 2.策略? ? ? ? 有了模型的假设空间,机器学习接着需要考虑的是按照什么样的准则学习或选择最优的模型。机器学习的目的在于从假设空间中选择合最优的模型。 ? ? ? ? 引入损失函数和风险函数的概念,损失函数用于度量模型一次预测的好坏,风险函数度量平均意义下模型的好坏。 2.1.损失函数? ? ? ? 以监督学习为例,监督学习是在假设空间 ? ? ? ? 常用的损失函数: ? ? ? ? ? ? ? ? (1) 0-1损失函数 ???????????????????????????????? ? ? ? ? ? ? ? ? (2) 平方损失函数 ???????????????????????????????? ? ? ? ? ? ? ? ? (3) 绝对损失函数 ???????????????????????????????? ? ? ? ? ? ? ? ? (4) 对数损失函数 或者 对数似然损失函数 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? 损失函数数值越小,表示它越接近最优的模型,即模型就越好。 2.2.风险函数? ? ? ? 由于模型的输入、输出 ???????????????????????? 这是理论上模型
? ? ? ? ?机器学习的目的就是选择期望风险最小的模型。由于联合分布P(X,Y)是未知的, 2.3.经验风险? ? ? ? 给定一个训练数据集: ???????????????????????????????? 模型 ???????????????????????????????? ? ? ? ? 期望风险 ?所以一个很自然的想法是用经验风险估计期望风险。但是有实现中训练样本数目有限,甚至很小,所以用经验风险来估计期望风险往往并不理想,要对经验风险进行一定的矫正。这就关系到监督学习的两个基本策略:经验风险最小化?和?结构风险最小化? ?2.4.经验风险最小化和结构风险最小化2.4.1经验风险最小化? ? ? ? 在假设空间、损失函数以及训练数据集确定的情况下,经验风险函数式(8) 就可以确定。经验风险最小化(empirical risk minimization,ERM)的策略认为,经验风险最小的模型是最优的模型。根据这一策略,按照经验风险最小化求解最优化问题: ???????????????????????? 当样本容量足够大时,经验风险最小化能保证有很好的学习效果,在现实中被广泛采纳。如:极大似然估计(maximum likelihood estimation)就是经验风险最小化的一个例子。当模型是条件分布,损失函数是对数损失函数时,经验风险最小化就等于极大似然估计。 2.4.2.结构风险最小化? ? ? ? 当样本容量很小时,经验风险最小化的效果就未必很好,会产生“过拟合”现象(over-fitting)。
? ? ? ? 结构风险最小化(structural risk minimization,SRM)是为了防止过拟合而提出来的策略。结构风险最小化等价于正则化(regularization)。结构风险在经验风险上加上表示模型复杂度的正则化项(regularizer)或惩罚项(penalty term)。结构风险的定义为: ???????????????????????? 其中 ? ? ? ? ?结构风险最小化的策略认为结构风险最小的模型是最优的模型,所以求最优模型,就是求优化问题: ???????????????????????? ? ? ? ? 这样,监督学习问题就变成了经验风险或结构风险的最优化问题。这时经验风险或结构风险是最优化的目标函数。 ? ?3.算法? ? ? ? ?算法是指学习模型的具体计算方法。机器学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的计算方法求解最优模型。? ?? ? ?注:本文的内容主要是 李航的《统计学习方法》中的总结 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年2日历 | -2025/2/21 3:47:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |