IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Python对电影数据简单分析 -> 正文阅读

[人工智能]Python对电影数据简单分析

文章说明:对movie_metadata数据做简单的分析处理,做了三个简单的案例分析,可在此基础上进行拓展和更好的分析。
movie_metadata数据下载链接

1、电影排行榜

import pandas as pd

# 数据预处理
movies_df = pd.read_csv('movie_metadata.csv')
movies_df = movies_df.drop_duplicates()  # 数据清洗去重
movies_df = movies_df.dropna()  # 删除缺失值


""" 字段说明
  imdb_score      电影在imdb上的评分
  movie_title     电影名称
"""

# 获取最大评分的电影
movie_sort_imdb_score = movies_df.sort_values(['imdb_score'], ascending=False).head(10)
movie_max_series = pd.Series(data=movie_sort_imdb_score['imdb_score'].values,
                             index=movie_sort_imdb_score['movie_title'])

print(movie_max_series)

"""写自己对这个结果的分析

"""

在这里插入图片描述

2、词云

from wordcloud import WordCloud
import pandas as pd
""" 对【plot_keywords】词云分析
1、提取字段数据并转为一行
2、生成词云
"""

# 数据预处理
movies_df = pd.read_csv('movie_metadata.csv')
movies_df = movies_df.drop_duplicates()  # 数据清洗去重
movies_df = movies_df.dropna()  # 删除缺失值

movies_plot_keywords = movies_df['plot_keywords']  # 提取plot_keywords数据
# print(movies_plot_keywords)
plot_keywords = ''
# 遍历数据
for word in movies_plot_keywords:
    plot_keywords += '|' + word

# print(plot_keywords)
wc = WordCloud().generate(plot_keywords)  # 生成词云
wc.to_file('xiaomu.jpg')  # 保存图片

"""写自己对这个结果的分析

"""

在这里插入图片描述

3、相关性分析

import pandas as pd

"""
1、将电影imdb上的评分和各个因素进行相关性分析
2、将相关性的占比做成百分比形式
"""

# 数据预处理(自己考量怎那么处理)
movies_df = pd.read_csv('movie_metadata.csv')
movies_df = movies_df.drop_duplicates()  # 数据清洗去重
movies_df = movies_df.dropna()  # 删除缺失值
drop_list = ['movie_imdb_link', 'num_voted_users', 'num_critic_for_reviews', 'num_user_for_reviews']
print(movies_df)
# movies_df.drop(labels=[drop_list], axis=1, inplace=True)  # 删除列

""" 字段说明
    facenumber_in_poster:      海报中的人脸数量
    director_name:             导演姓名 
    movie_title:               电影片名
    director_facebook_likes:   脸书喜欢该导演的人数 
    title_year:                电影年份
    duration:                  电影时长
    actor_1_name:              男一号姓名 
    country:                   国家
    actor_1_facebook_likes:    脸书上喜爱男一号的人数 
    genres:                    电影题材
    color:                     画面颜色。
    actor_2_name:              男二号姓名 
    aspect_ratio:              画布的比例
    actor_2_facebook_likes:    脸书上喜爱男二号的人数 
    content_rating:            电影分级
    plot_keywords:             剧情关键字
    actor_3_name:              三号男演员姓名 
    language:                  语言
    actor_3_facebook_likes:    脸书上喜爱3号男演员的人数 
    budget:                    制作成本
    cast_total_facebook_likes: 脸书上投喜爱的总数 
    gross:                     总票房
    movie_facebook_likes:      脸书上被点赞的数量 
    movie_imdb_link:           imdb地址
    imdb_score:                imdb上的评分
    num_voted_users:           参与投票的用户数量
    num_critic_for_reviews:    评论家评论的数量
    num_user_for_reviews:      用户的评论数量
"""
# 将所有的字段和 【gross】 字段做相关性分析
movies_imdb_score = movies_df.corr()['imdb_score']
# 将gross删除并排序(降序)
movies_imdb_score = movies_imdb_score.sort_values(ascending=False).drop("imdb_score")
# 将类型转为DataFrame
movies_imdb_score = movies_imdb_score.to_frame()
# 重置索引(将索引构造出来)
movies_imdb_score = movies_imdb_score.reset_index()
# 改列名为【field】和【imdb上的评分】
movies_imdb_score.rename(columns={'index': 'field', 'imdb_score': 'imdb_score_corr'}, inplace=True)
print(movies_imdb_score)

"""写自己对这个结果的分析

"""

在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-29 12:08:38  更:2022-04-29 12:10:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 8:52:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码