IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> XGBoost算法介绍及代码实现 -> 正文阅读

[数据结构与算法]XGBoost算法介绍及代码实现

XGBoost是基于决策树的集成机器学习算法,它以梯度提升(Gradient Boost)为框架。在 SIGKDD 2016 大会上,陈天奇和Carlos Guestrin 发表的论文“XGBoost: A Scalable Tree Boosting System”在整个机器学习领域都引起了轰动,并逐渐成为Kaggle 和数据科学界的主导。XGBoost同样也引人了 Boosting算法。
XGBoost除了在精度和计算效率上取得成功的性能外,还是一个可扩展的解决方案。由于对初始树Boost GBM 算法进行了重要调整,因此XGBoost代表了新一代的GBM算法。

主要特点

  • 采用稀疏感知算法,XGBoost 可以利用稀疏矩阵,节省内存(不需要密集矩阵)和节省 计算时间(零值以特殊方式处理)。

  • 近似树学习(加权分位数略图),这类学习方式能得到近似的结果,但比完整的分支切割探索要省很多时间。

  • 在一台机器上进行并行计算(在搜索最佳分割阶段使用多线程),在多台机器上进行类 似的分布式计算。

  • 利用名为核外计算的优化方法,解决在磁盘读取数据时间过长的问题。将数据集分成多个块存放在磁盘中,使用一个独立的线程专门从磁盘读取数据并加载到内存中,这样一来,从磁盘读取数据和在内存中完成数据计算就能并行运行。

  • XGBoost还可以有效地处理缺失值,训练时对缺失值自动学习切分方向。基本思路是在每次的切分中,让缺失值分别被切分到决策树的左节点和右节点,然后通过计算增益得分选择增益大的切分方向进行分裂,最后针对每个特征的缺失值,都会学习到一个最优的默认切分方向。

代码实现
输入:训练集x_train,训练集标签y_train
验证集 x_valid,验证集标签y_valid,测试集 xtest
输出:训练好的模型model,测试集结果y_pred

import xgboost as xgb
params ={'eta': 0.01,'max_depth': 11,'objective': 'reg:linear', "eval_metric': 'rmse’)
dtrain=xgb.DMatrix(data=x train, label=y_train) 
dtest =xgb.DMatrix(data=X_valid, label=y_valid)
watchlist =[(train data, 'train'),(valid_data, 'valid_data')] 
model=xgb.train(param, train_data,num_boost_round=20000, evals=watchlist,
early_stopping_rounds=200, verbose_eval=500)
y_pred mmodel.predict(xgb.DMatrix(x_test),ntree_limit=model.best_ntree_limit)
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-03-10 22:50:47  更:2022-03-10 22:53:17 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 13:45:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码