IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 傻瓜版机器学习(1)-机器学习的基础术语 -> 正文阅读

[人工智能]傻瓜版机器学习(1)-机器学习的基础术语

博主是个懒癌晚期患者,偶然间接触了许多关于机器学习,计算机视觉,最优化方法,博弈论,运筹学,又学了一点matlab,python,c++,c语言,java等所以就想做一点知识分享,也能帮助其它一样和我懒癌晚期的朋友可以简单的直接学习,所以就萌生了这个想法,可能技术一般,有些许错误,希望各位大佬赐教,指出,主要优点是将程序和数学原理相结合(展现出程序内部的数学思想)

机器学习的一些基础概念

学习(训练)

基本要求:独立同分布:样本空间的全体样本都服从一个未知的分布且相互独立

训练集:参与模型训练的样本集合

测试:学习模型后,使用其样本进行预测的过程

测试集:被预测的样本集合·

假设:学习得模型对应的关于数据的某种潜在规律

分类:输出结构是离散值

回归:输出结果是连续值

监督学习:训练样本有标记

无监督学习:训练样本无标记

泛化能力:学得模型使用新样本的能力

假设空间

归纳:从特殊到一般的“泛化”:从样本(训练样本)中学习

演绎:从一般到特殊:从数学公理推到出定理

版本空间:与训练空间一致的架设几何称为“版本空间”

模型(学习器)的偏好

归纳偏好的原则:奥卡姆剃刀(简单优先)

经验误差与过拟合

误差:模型输出与样本真实值之间的差异

错误率:分类错误样本数占总样本数比例

精度=1-错误率

训练误差:模型在训练集上的误差

泛化误差:模型在新样本上的误差

目标:得到泛化误差小的模型 / 学习器(模型)从训练样本中学的适用于所有潜在样本的“普遍规律”(实际上新样本未知,因此我们以经验误差代表泛化误差)

评估方法

目标:对于模型/学习器的泛化误差进行评估

专家样本:训练集+测试集

训练集:训练误差

测试集:测试误差

测试误差与泛化误差

留出法,交叉验证法,自助法

留出法(训练集+测试集,互斥互补,合理划分,保持比例)

训练集训练模型,测试集测试模型,单次留出,多次留出

多次留出法:如对专家样本随机进行100次训练集/测试集划分,评估结果取平均

交叉验证法(单次k折交叉验证,p次k折交叉验证

K折交叉验证:将专家样本等分为k个数据集轮流用k-1个数据集用于训练,1个用于测试

自助法

  1. 留出法与交叉验证的训练集数据少于样本数据
  2. 给定m个样本的数据集D,从D中有放回随机抽取m次数据形成训练集D‘
  3. 用D中不含D‘的样本作为测试集
  4. D中某个样本不被抽中概率为
  5. 测试集数据占比
  6. 缺点:改变了初始集的分布

性能度量

评价方法与评价标准

回归任务的评价标准:均方误差

?

精度=1-错误率(分类正确样本数占总样本数比例)

错误率:分类错误样本数占总样本数比例

?

?

ID

Real(真实)

Pre(预测)

1

m

m

2

w

w

3

m

m

4

m

w

5

w

w

pre

real

1(m)

0(w)

1(m)

tp

Fn

0(w)

fp

tn

pre

real

1(m)

0(w)

1(m)

2

1

0(w)

0

2

Tp:实际为男性预测为男性,fn实际为男性预测为女性

fp实际为女性预测为男性,tn实际为女性预测为女性

设定tp和tn的值为2,fn为1,fp为0

查准率/准确率(precision):

查全率/召回率/灵敏度(recall):

F1系数 综合查准率与查全率(设样本总量为k)

一般形式,为正数度量了查全率对查准率的相对重要性

更关注查准率,更关注查全率,标准的F1系数

多次训练/测试时的F1系数

先分后总:分别计算各混淆矩阵的查准率和查全率再以均值汇总

????

先总后分:将混淆矩阵的对应元素(tp,fp,tn,fn)进行汇总平均,再求P

????

?

?

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-23 16:41:36  更:2021-08-23 16:41:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/1 12:27:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码