IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 学习Python第十二天 -> 正文阅读

[人工智能]学习Python第十二天

何为分类分析

在机器学习和统计中,分类是基于包含其类别成员资格已知的观察(或实例)的训练数据集来识别新观察所属的一组类别(子群体)中的哪一个的问题。
例如,将给定的电子邮件分配给“垃圾邮件”或“非垃圾邮件”类,并根据观察到的患者特征(性别,血压,某些症状的存在或不存在等)为给定患者分配诊断。
分类是模式识别的一个例子。
在机器学习的术语中,分类被认为是监督学习的一个实例,即学习可以获得正确识别的观察的训练集的情况。
相应的无监督程序称为聚类,并涉及基于固有相似性或距离的某种度量将数据分组。
通常,将各个观察结果分析为一组可量化的属性,不同地称为解释变量或特征。
这些属性可以不同地分类(例如,“A”,“B”,“AB”或“O”,对于血型),序数(例如“大”,“中”或“小”),整数值(例如,电子邮件中特定单词的出现次数)或实际值(例如血压的测量值)。
实现分类的算法,特别是在具体实现中,被称为分类器。
术语“分类器”有时也指由分类算法实现的数学函数,其将输入数据映射到类别。
跨领域的术语是多种多样的。
在统计中,通常使用逻辑回归或类似程序进行分类,观察的属性称为解释变量(或独立变量,回归量等),要预测的类别称为结果,被认为是是因变量的可能值。
在机器学习中,观察通常被称为实例,解释变量被称为特征(被分组为特征向量),并且要预测的可能类别是类。
其他领域可能使用不同的术语:
例如,在社区生态学中,术语“分类”通常是指聚类分析,即一种无监督学习,而不是本文中描述的监督学习。
常用分类算法:常用的分类算法包括朴素贝叶斯、逻辑回归、决策树、随机森林、支持向量机等。
分类分析使用场景:用于分类:分类的主要用途和场景是“预测”,基于已有的样本预测新样本的所属类别。例如信用评级、风险等级、欺诈预测等;同时,它也是模式识别的重要组成部分,广泛应用到机器翻译,人脸识别、医学诊断、手写字符识别、指纹识别的图像识别、语音识别、视频识别的领域;
另外,分类算法也可以用于知识抽取,通过模型找到潜在的规律,帮助业务得到可执行的规则。
提炼应用规则:为数据化运用提供规则,也是分类分析的主要应用方向。
常见应用场景:对沉默会员做会员重新激活,应该挑选具有何种特征会员商品选取何种促销活动清仓那些广告更适合VIP商家的投放需求提炼特征规则利用的是在构建分类算法时产生的分类规则。
提取变量特征:从大量的输入变量的重要性特征,然后提取权重较高的几个特征是分类分析的重点应用之一。是数据归约和数据降维的重要方式。
获取原始数据集并对数据预处理,然后将数据集放到分类算法中进行训练,然后冲算法模型中提取特征权重信息。
处理缺失值:将缺失字段作为目标变量进行预测,从而得到较为可能的补全值。
分类分析算法的选取:文本分类时用到最多的是朴素贝叶斯训练集比较小,那么选择高偏差且低方差的分类算法效果逢高,如朴素贝叶斯、支持向量机、这些算法不容易过拟合。训练集比较大,选取何种方法都不会显著影响准去度省时好操作选着用支持向量机,不要使用神经网络重视算法准确度,那么选择算法精度高的算法,例如支持向量机、随机森林。想得到有关预测结果的概率信息,使用逻辑回归需要清洗的决策规则,使用决策树。## 标题

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-26 12:05:46  更:2021-07-26 12:07:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年4日历 -2024/4/25 12:26:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码