IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> [集成学习]案例学习 -> 正文阅读

[人工智能][集成学习]案例学习

幸福感预测(离散问题)

  1. 数据预处理
    异常值处理:删除明显的异常值
    对于缺失值来说:若某列缺失值过多,则无法提供更多信息,可以删去该列;对于含有部分缺失值的列,可以通过增补平均数、众数、中位数的方法补全缺失值(对于此次像问卷形式的分类问题,也可以将自己当作受访者来补全缺失值),若缺失值极少,对模型的建立影响很小,可以直接删除含有该缺失值的数据行。
    其他:若分类问题中的部分变量是连续值,可以将该变量离散化
  2. 数据增广
    分析特征之间的关系,通过数学运算增加一些对分类有影响的特征(如:悠闲指数、收入比、社会阶级等特征)
  3. 特征选择
    通过计算各个特征与目标列之间的相关性,筛选出与目标列相关性大的特征,去除那些与目标列无关的特征
  4. 特征建模
    建立lightgbm、xgboost、RandomForestRegressor随机森林等模型,对这些模型进行5折交叉验证得到结果

蒸汽量预测(连续问题)

  1. 探索数据分布
    a. 查看每个特征分别在测试集与训练集上的分布情况是否相似,若分布相似,则可以进行进一步的分析,若不相似,则删除这些特征的数据
    b. 计算各个特征之间的相关性,若相关性很小,则删除该特征
    c. 归一化:将所有特征的值映射到[0,1]之间
  2. 特征工程
    利用Box-Cox方法对数据进行变换,一定程度上减小不可观测的误差和预测变量的相关性。
  3. 模型构建
    a. 构建训练集与测试集后,找出离群值,并进行删除
  4. 集成学习

参考:
[1]https://github.com/datawhalechina/ensemble-learning

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-01 14:30:37  更:2021-08-01 14:31:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/17 20:21:05-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码