[人工智能] IntegratedLearning

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> IntegratedLearning_Task01 -> 正文阅读

[人工智能]IntegratedLearning_Task01

Datawhale 集成学习 Task01 笔记

本次学习内容：

了解sklearn中读取数据、生成数据。
并简单介绍回归与分类。
以下案例内容采用Datawhale资料，所有函数并不在此过多赘述，详情查看下方API。

sklearn 中所有内置数据集封装在datasets对象中，返回的对象中：

data: 特征X的矩阵(ndarray)
target: 因变量的向量 (ndarray)
feature_names: 特征名称 (ndarray)

from sklearn import boston, iris
boston = datasets.load_boston()  #boston 房价数据集
iris = datasets.load_iris()  # iris 数据集

关于 seaborn、matplotlib绘图详见动手数据分析

关于使用sklearn生成数据集，详见本节 1.3 无监督学习 内容

1.1 回归

boston 房价数据集加载 + 可视化

from sklearn import datasets
boston = datasets.load_boston()     # 返回一个类似于字典的类
X = boston.data
y = boston.target
features = boston.feature_names
boston_data = pd.DataFrame(X,columns=features)
boston_data["Price"] = y
boston_data.head()

sns.scatterplot(boston_data['NOX'],boston_data['Price'],color="r",alpha=0.6)
plt.title("Price~NOX")
plt.show()

1.2 分类

iris 数据集加载 + 可视化

from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
y = iris.target
features = iris.feature_names
iris_data = pd.DataFrame(X,columns=features)
iris_data['target'] = y
iris_data.head()

# 可视化特征
marker = ['s','x','o']
for index,c in enumerate(np.unique(y)):
    plt.scatter(x=iris_data.loc[y==c,"sepal length (cm)"],y=iris_data.loc[y==c,"sepal width (cm)"],alpha=0.8,label=c,marker=marker[c])
plt.xlabel("sepal length (cm)")
plt.ylabel("sepal width (cm)")
plt.legend()
plt.show()

1.3 无监督学习

sklearn 官方 API 此处

**生成月牙型非凸集

from sklearn import datasets
x, y = datasets.make_moons(n_samples=2000, shuffle=True,
                  noise=0.05, random_state=None)
for index,c in enumerate(np.unique(y)):
    plt.scatter(x[y==c,0],x[y==c,1],s=7)
plt.show()

生成符合正态分布的聚类数据

from sklearn import datasets
x, y = datasets.make_blobs(n_samples=5000, n_features=2, centers=3)
for index,c in enumerate(np.unique(y)):
    plt.scatter(x[y==c, 0], x[y==c, 1],s=7)
plt.show()

.unique(y)):
plt.scatter(x[yc, 0], x[yc, 1],s=7)
plt.show()


[外链图片转存中...(img-1DH7rCY7-1626444247862)]

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-07-17 11:54:48 更:2021-07-17 11:55:26

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/5 4:40:19-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码