IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 如何使用Sklearn.KFold和Split生成训练和验证集? -> 正文阅读

[人工智能]如何使用Sklearn.KFold和Split生成训练和验证集?

使用Sklearn 进行K折交叉验证,代码咋写呢

开始正文

  1. 先导入需要的库
import pandas as pd
import numpy as np
from sklearn.model_selection import KFold
  1. 读入数据,可以用 pd.read_csv(‘路径名’)。这里就假设数据。假设有5个训练样本x,各对应着一个标签y.
    下面代码的y_train是numpy.ndarray 类型,为了使用列表进行索引方便。
y_train = np.array([1,0,1,1,0])  
X_train = pd.DataFrame([[1,2],[3,4],[5,6],[7,8],[9,10]])
  1. K折交叉验证,设置 K = 5 假设5折吧,所以例子中每次有4个样本用于训练,1个样本用于验证。
K = 5  # 折数改这里
folds = KFold(n_splits= K, shuffle = True, random_state= 0) # 设置random_state,是为了每次都可以重复

#  这是把全部的训练数据拆分成了K份,K-1 份测试,1份验证  
for trn_idx, val_idx in folds.split(X_train,y_train):
    train_df, train_label = X_train.iloc[trn_idx,:],y_train[trn_idx]
    valid_df, valid_label = X_train.iloc[val_idx,:],y_train[val_idx]
    #X_train可以使用iloc, 注意y_train必须使用np.array()转化一下才能使用列表作为索引
    接着在这个for循环里就可以将训练集和验证集分别用于训练和验证了

上边的trn_idx是存放四个训练样本的索引的列表,val_idx是作为验证集的那一个样本的索引。

我觉得易错点在于
train_df, train_label = X_train.iloc[trn_idx,:],y_train[trn_idx] 这句。X_train是DataFrame类型,所以可以使用iloc索引,行数传入了 trn_idx 这样一个列表索引没有问题。(菜到没脾气)

y_train注意要给它转化为numpy.ndarray 类型类型,这样才能使用列表进行索引!!

下面插播废话

在这里插入图片描述

工位周围其他组的人在讨论发论文… 写个记录来自娱自乐一下,嘿嘿
不管现在处于哪个阶段,一点一点地总能走到开悟之坡上去…

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-22 10:56:24  更:2021-10-22 10:58:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 8:25:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码