IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> pandas学习笔记:02、统计电影分类情况 -> 正文阅读

[人工智能]pandas学习笔记:02、统计电影分类情况

'''
    -*- coding: utf-8 -*-
    @Author  : Dongze Xu
    @Time    : 2021/12/10 20:35
    @Function: 
'''
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

'''
    设置dataframe显示数据
'''
#显示Dateframe所有行
pd.set_option('display.max_rows',None)
#显示Dateframe所有列(参数设置为None代表显示所有行,也可以自行设置数字)
pd.set_option('display.max_columns',None)
#设置Dataframe数据的显示长度,默认为50
pd.set_option('max_colwidth',200)
#禁止Dateframe自动换行(设置为Flase不自动换行,True反之)
pd.set_option('expand_frame_repr', False)

movie = pd.read_csv("./data/IMDB-Movie-Data.csv")
# print(movie.head())

'''
    我们希望统计电影分类(genre)的情况
    分析:
        1、先将Genre列的数据存储到一个列表里面,由于每行不止一个数据且用“,”分割,我们可以用split方法进行切分
        2、然后我们需要知道有多少种不同种类得电影,再对整个列表进行去重
        3、我们生成一个二维矩阵来存储统计的信息,行数是数据的总行数,列代表不同种类的电影名称,i行j列代表的就是i行是否出现过j列的数据
        4、对矩阵每一列进行求和,得出每个电影出现次数的总和,然后进行排序
        5、画图
'''
#1、先将Genre列的数据存储到一个列表里面,由于每行不止一个数据且用“,”分割,我们可以用split方法进行切分
movie_list = [i.split(",") for i in movie["Genre"]]
single_movie_list = [j for i in movie_list for j in i]
#2、然后我们需要知道有多少种不同种类得电影,再对整个列表进行去重
fin_movie_list = np.unique(single_movie_list)
print(fin_movie_list)

#3、我们生成一个二维矩阵来存储统计的信息,行数是数据的总行数,列代表不同种类的电影名称,i行j列代表的就是i行是否出现过j列的数据
zeros_matrix = np.zeros([movie.shape[0], fin_movie_list.shape[0]])
data_matrix = pd.DataFrame(zeros_matrix, columns=fin_movie_list)

#遍历movie_list得到原数据每行的电影名
#在对应位置上给相应的电影名加1,统计出现次数
for i in range(1000):
    str_list = movie_list[i]
    data_matrix.loc[i, movie_list[i]] = 1

print(data_matrix.head())

#4、对矩阵每一列进行求和,得出每个电影出现次数的总和,然后进行排序
genre = data_matrix.sum().sort_values(ascending=True)

# print(genre)
genre.plot(kind="bar", colormap="cool", figsize=(30, 15), fontsize=16)
plt.show()

在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-11 15:43:23  更:2021-12-11 15:44:07 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 0:17:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码