IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 大数据分析机器学习(二)之直方图和多元线性回归 -> 正文阅读

[人工智能]大数据分析机器学习(二)之直方图和多元线性回归

上一次的文章一元线性回归

数据例子

以下是一个plt画出房子,人口,年龄等数据的直方图,为什么要画直方图呢?因为直方图本身是一种统计数据,比如年龄为45的总共有几个,年龄为30的总共有几个,学会画直方图以后,就可以从数据直方图中获取部分启发式洞见。先不要管意义是什么,先学会画直方图,在python中使用pandas和matplotlib.pyplot来画出直方图,并且理解,直方图是"直观分类"的统计就行
数据如下图所示
在这里插入图片描述
这一份数据有2万多行,本身其实就是大数据的统计后的数据,然后再进行二次分析,代表着经纬度的房子上的数据,一次一次的数据统计和清洗,本身就是一个艰苦的工作,所以网络上存在着那种所谓的平台,能直接做出最终结果的工具,几乎是很难做到的,数据科学是一个需要"洞见"的科学。

import pandas as pd
import os 
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
def load(path):
    csvpath = os.path.join(path,"housing.csv")
    return pd.read_csv(csvpath)
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False


hdata=load("./datasets/housing")
print(hdata.head())
print(hdata.info())

hdata.hist(bins=50,figsize=(20,15))
plt.show();

在这里插入图片描述

摄像头例子

以下是摄像头数据,这是一份虚拟数据,经纬度上的摄像头记录了每小时经过的人流和车流,以及摄像头的品牌
在这里插入图片描述
在这里插入图片描述
先看摄像头的品牌直方图

hdata=load("./datasets")
print(hdata.head())
print(hdata.info())
hdata["brand"].hist()
#hdata.plot(kind="scatter", x="longitude", y="latitude")
#hdata.hist(bins=50,figsize=(20,15))
plt.show();

在这里插入图片描述
显示了hik,dah,yushi三个品牌的摄像头个数,很直观吧

数据清理

使用pandas DataFrame 属性中:
1 dropna() 函数
2 drop() 函数
3 fillna() 函数

median = data["people"].median()
data["people"].fillna(median)

意思为将数据中为空的未曾统计的经过摄像头的数目都使用中位均值来代替。

数据预测

下面使用上一次我们使用的线性回归来预测经过某一个摄像头的人口流量
当然说明:所有数据都是模拟的,并且真实的预测并没有如此"线性",而是和很多因素有关。这里做简单的计算,和上一次不同的是使用多元线性回归。

import pandas as pd
import os 
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
import numpy as np 
import sklearn.linear_model

def load(path):
    csvpath = os.path.join(path,"camera.csv")
    return pd.read_csv(csvpath)
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False


hdata=load("./datasets")
print(hdata.head())
print(hdata.info())
hdata["brand"].hist()


#X = np.c_[hdata["longitude"]] + np.c_[hdata["latitude"]]
#Y = np.c_[hdata["people"]]

X = hdata.loc[:, ('longitude','latitude')]
Y = hdata.loc[:, 'people']
print(X)
print(Y)
"""多元线性
"""
model = sklearn.linear_model.LinearRegression()
model.fit(X, Y)
X_new = [[217,135]]
print(model.predict(X_new))

#hdata.plot(kind="scatter", x="longitude", y="latitude")
#hdata.hist(bins=50,figsize=(20,15))
plt.show();

在这里插入图片描述
预测出位置217,135在这个时间段的人口流量为281左右。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-18 17:43:23  更:2022-04-18 17:43:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:31:55-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码