IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 机器学习(西瓜书1,2章) -> 正文阅读

[人工智能]机器学习(西瓜书1,2章)

监督学习(supervised learning)
分类classification

  • 二分类
  • 多分类
    (预测离散值)
    回归regression
    (预测连续值)
    无监督学习(unsupervised learning)
    聚类(clustering)
    将数据集中的样本划分成若干组(cluster),对特征空间的一种划分
    学习过程中使用的训练样本通常不具有标记信息

常用算法:KNN、Kmeans、密度聚类、层次聚类

模型的评估与选择
1.基础概念
错误率(error rate): m个样本中有a个样本分类错误 E=a/m
精度(accuracy):精度=1-error rate 即 arruracy=(1-a/m)*100%
误差(error):模型的实际预测值和样本真实输出之间的差异
训练误差:model 在训练集上的误差
泛化误差:model 在新样本上的误差
欠拟合(underfitting):model对训练样本的一般性质还未学好
过拟合(overfitting):model的学习能力过于强大,甚至把训练样本不太一般的性质都学到了

2.评估方法
通常使用测试集(testing set)来检测model 的泛化能力
学习模型应采用泛化(generalization)能力强的模型

  1. 留出法(分层采样):把数据集7:3分为训练集和测试集(二者互斥)
  2. 交叉验证法(k折交叉验证):将数据集划分为k个大小相似的互斥子集用k-1个子集作为训练集,余下的那个作测试集,进行k次训练,取k个测试结果的均值
  3. 自助法(bootstrapping):自助采样法

3,性能度量
(1)查准率precision,查全率recall
TP:正确地标记为正,即算法预测它为好西瓜,这个西瓜真实情况也是好西瓜(双重肯定是肯定);
FP:错误地标记为正,即算法预测它是好西瓜,但这个西瓜真实情况是坏西瓜;
FN:错误地标记为负,即算法预测为坏西瓜,(F算法预测的不对)但这个西瓜真实情况是好西瓜(双重否定也是肯定);
TN:正确地标记为负,即算法标记为坏西瓜,(T算法预测的正确)这个西瓜真实情况是坏西瓜。
请添加图片描述
(2)二者的关系(矛盾)
P-R曲线
请添加图片描述
性能:A>B>C

(3)F1度量:查准率和查全率的平均调和(harmonic mean)
1/F1=1/2(1/P +1/R)*
请添加图片描述
加权平均调和
请添加图片描述
(4)ROC AUC
详细解析见此文章
(5)方差和误差
见我的上一篇文章

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-18 12:42:30  更:2021-08-18 12:43:01 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 19:44:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码