IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> ML_Multiple Linear Regression -> 正文阅读

[数据结构与算法]ML_Multiple Linear Regression

第一步:导包

#Step 1: Data Preprocessing
import pandas as pd
import numpy as np

第二步:导入数据

#Step 2: Importing the dataset
dataset = pd.read_csv('D:/daily/机器学习100天/100-Days-Of-ML-Code-中文版本/100-Days-Of-ML-Code-master/datasets/50_Startups.csv')
X = dataset.iloc[ : , :-1].values
Y = dataset.iloc[ : ,  4 ].values

第三步:编码

#Step 3: Encoding Categorical data
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder()
X_3 = labelencoder.fit_transform(X[:,3])
X[:,3] = X_3
print(X_3)
State = X[:,3]
State = State.reshape(-1,1)  # 转换为多行一列的形式
env = OneHotEncoder(categories = 'auto').fit(State)
res = env.transform(State).toarray()
X = np.hstack((X[:, :3], res))  # OneHot后的最后一列与之前两列拼接起来

打印:
X_3

[2 0 1 2 1 2 0 1 2 0 1 0 1 0 1 2 0 2 1 2 0 2 1 1 2 0 1 2 1 2 1 2 0 1 0 2 1
 0 2 0 0 1 0 2 0 2 1 0 2 0]

res

[[0. 0. 1.]
 [1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]
 [0. 1. 0.]
 [0. 0. 1.]
......

即2的独热编码为[0,0,1],0的独热编码为[1,0,0],1的独热编码为[0,1,0]。

第四步:避免虚拟变量陷阱

#Step 4: Avoiding Dummy Variable Trap
X = X[ : , :3]

第五步:划分训练集、测试集

#Step 5: Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.2, random_state = 0)

第六步:多重线性回归拟合

#Step 6: Fitting Multiple Linear Regression to the Training set
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, Y_train)

第七步:预测

#Step 7: Predicting the Test set results
y_pred = regressor.predict(X_test)

第八步:回归性能指标

#Step 8: regression evaluation
from sklearn.metrics import r2_score
print(Y_test)
print(y_pred)
print(r2_score(Y_test, y_pred))

打印:0.9393955917820571

R2 决定系数(拟合优度),模型越好:r2→1;模型越差:r2→0

完整代码:

#Day 3: Multiple Linear Regression 2022/4/6

#Step 1: Importing the libraries
import pandas as pd
import numpy as np

#Step 2: Importing the dataset
dataset = pd.read_csv('D:/daily/机器学习100天/100-Days-Of-ML-Code-中文版本/100-Days-Of-ML-Code-master/datasets/50_Startups.csv')
X = dataset.iloc[ : , :-1].values
Y = dataset.iloc[ : ,  4 ].values

#Step 3: Encoding Categorical data
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder()
X_3 = labelencoder.fit_transform(X[:,3])
X[:,3] = X_3
print(X_3)
State = X[:,3]
State = State.reshape(-1,1)  # 转换为多行一列的形式
env = OneHotEncoder(categories = 'auto').fit(State)
res = env.transform(State).toarray()
X = np.hstack((X[:, :3], res))  # OneHot后的最后一列与之前两列拼接起来

#Step 4: Avoiding Dummy Variable Trap
X = X[ : , :3]
print(X)
#Step 5: Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.2, random_state = 0)

#Step 6: Fitting Multiple Linear Regression to the Training set
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, Y_train)

#Step 7: Predicting the Test set results
Y_pred = regressor.predict(X_test)

#Step 8: regression evaluation
from sklearn.metrics import r2_score
#print(Y_test)
#print(Y_pred)
print(r2_score(Y_test, Y_pred))
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-04-06 23:27:37  更:2022-04-06 23:30:20 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 9:27:26-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码