IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 实验三 利用flask框架和Echarts实现电影榜单可视化 -> 正文阅读

[Python知识库]实验三 利用flask框架和Echarts实现电影榜单可视化

?先看成品图

?

代码有点多放在我的github上

https://github.com/longsongline/douban-bigdata-showicon-default.png?t=M4ADhttps://github.com/longsongline/douban-bigdata-show

使用具体流程

1.先运行dashuju3.py

这个是用于爬取的豆瓣top250的代码,会生成一个csv文件

1.import?requests
2.import?bs4
3.import?csv
4.
5.from?lxml?import?etree
6.import?requests
7.import??time
8.import?os
9.
10.import?datetime
11.import?time
12.#创建或者写入csv
13.csv_file=open('dashuju250.csv',?'w',?newline='',encoding='utf-8')
14.writer?=?csv.writer(csv_file)
15.#列名添加
16.writer.writerow(['No',?'name',?'score',?'recommendation',?'yanyuan','daoyan','year','country','classes'])
17.#请求头越猛越好,反正这个豆瓣就是让你爬的,不用那么多也行
18.headers?=?{
19.????????'User-Agent':?'Mozilla/5.0?(Windows?NT?6.1;?WOW64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/66.0.3359.181?Safari/537.36',
20.????????'Cookie':?'lang=zh-cn;?theme=default;?ajax_lastNext=on;?selfClose=1;?bugModule=0;?bugBranch=0;?treeBranch=0;?moduleBrowseParam=0;?openApp=qa;?windowWidth=659;?windowHeight=706',
21.????}
22.#因为有十个页面,所以目前采用分别爬取
23.for?x?in?range(10):
24.????#每一个的连接
25.????url?=?'https://movie.douban.com/top250?start='?+?str(x*25)?+?'&filter='
26.????res?=?requests.get(url,?headers=headers)
27.????#靓汤出马
28.????bs?=?bs4.BeautifulSoup(res.text,?'html.parser')
29.????bs?=?bs.find('ol',?class_="grid_view")
30.????#就打开f12找需要的东西的<li>在哪
31.????for?titles?in?bs.find_all('li'):
32.????????print(titles)
33.????????num?=?titles.find('em',class_="").text
34.????????title?=?titles.find('span',?class_="title").text
35.????????comment?=?titles.find('span',class_="rating_num").text
36.????????others=titles.find('div',class_='bd').find('p').text.strip('').split('\n')
37.
38.????????if?'\xa0\xa0\xa0'?in?others[1]:
39.????????????actors_director=others[1].strip('').split('\xa0\xa0\xa0')
40.????????????director=actors_director[0].strip('?')
41.????????????actors=actors_director[1]
42.????????else:
43.????????????actors_director=others[1].strip('').split('\xa0\xa0\xa0')
44.????????????director=actors_director[0].strip('?')
45.????????????actors=''
46.
47.????????year_country_type=others[2].strip('').split('\xa0/\xa0')
48.????????year=year_country_type[0].strip('?')
49.????????country=year_country_type[1]
50.????????movie_type=year_country_type[2]
51.????????#对于可能存在的空数据,可以用if/else语句分情况讨论,这样就不会无法运行或者碰到数据不完整的情况了
52.????????if?titles.find('span',class_="inq")?!=?None:
53.????????????tes?=?titles.find('span',class_="inq").text
54.????????????writer.writerow([num?,?title?,?comment?,?tes?,?actors,director,?year,?country,?movie_type])
55.????????else:
56.????????????writer.writerow([num?,?title?,?comment?,?'',?actors,director,?year,?country,?movie_type])???
57.#关上罪恶的文件
58.csv_file.close()

?

?这个文件想直接获取的话就下载就行了

这样就可以省去这一步

https://download.csdn.net/download/long_songs/85406980https://download.csdn.net/download/long_songs/85406980

2.运行ciyun.py

制作词云

这一步,如果也不想做,直接把图片偷走就好了

?然后再换底运行

3.huandi.py

换成蓝色的底部,因为我的可视化的色调是蓝色的

?4.布置准备好,替换好路径后,运行app.py 的flask,打开网址即可显示出你的高档可视化成果啦!

有什么问题可以留言或者私信我

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-05-27 17:17:41  更:2022-05-27 17:17:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/27 15:17:55-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计