IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> python爬虫大作业 -> 正文阅读

[人工智能]python爬虫大作业

Python爬虫大作业

一、大作业要求

结合所选专业方向(信息处理、嵌入式、人工智能、大数据处理),用所学Python技术设计并实现一个与专业方向技术相关的、功能完整的系统,并撰写总结报告。

?实现要求:
(1)实现时必须涵盖以下技术:
图形界面、
多线程、
文件操作、
数据库编程、
网页爬虫、
异常处理。
缺一不可。少一项则直接影响是否及格。
同时还可结合具体系统功能,使用其它扩展库进行实现。如统计绘图、机器学习等。

举例:
A方向可侧重于应用系统,结合爬虫丰富系统功能,提升用户体验。
B方向如果结合硬件有困难,可从上述方向中选择一个完成;否则可考虑实现物联网。
C方向可侧重于爬取网站图片,并进行图形或图像识别。
D方向可侧重于基于爬虫进行数据采集,并进行数据的统计分析。

(2)系统要具有一定复杂度。应用系统的业务流程不能过于简单,数据库表不能少于5张表。爬取图片不能少于500张。采集数据不能少于1000条,统计分析的目标不能少于3个。

(3)实现时要考虑模块化,不能将所有功能均在一个程序内实现。

???下文以大数据D方向为例实现

大作业报告要求~~
(一)报告内容涵盖:
(1)任务需求分析
(2)设计方案(例如:设计用于数据采集的爬虫结构;存储数据方案,如数据库设计;数据分析方案,如从哪些角度分析采集到的数据)
(3)实现细节(如界面实现、业务实现、爬虫实现、数据存储实现、分析实现等)
(4)运行结果

(二)报告格式要求:
(1)正文小四字号,中文为宋体字体,英文数字均为Times New Roman字体。行间距18磅。每个段落首行缩进2字符。
(2)各级标题四号黑体。
(3)每个图要有标号和图名(例:图1 实现数据爬取的程序流程图),标号和图名在图下标识。每个表要有标号和表名(例:表1 Table表结构),标号和表名在表上方标注。
(4)报告页数不能少于12页

成绩评定标准:balabalabala

二、设计方案

1、设计对斗鱼主页进行爬虫,包括直播间封面,主播头像,直播分区。
斗鱼主页https://www.douyu.com/directory/all
斗鱼分区https://www.douyu.com/directory
斗鱼热门视频https://v.douyu.com
2、利用chromedriver.exe进行模拟手动翻页等操作(爬取安全但是速度特别慢 ),使用python3实现爬取数据,使用sqlite数据库进行数据存储,使用pandas模块进行数据分析,使用wxpython模块实现界面。
三、作业软件选择
win10系统,google浏览器,pycharm编译器,navicat数据库管理界面,sqlite数据库,python3.10,。
四、作业实现成果
共包含图形界面、多线程、文件操作、数据库编程、网页爬虫、统计分析并绘图(或数据挖掘)六项技术,

共爬取1000余位主播信息。
2000余张图片。
代码在两个程序内实现。(一个图形实现界面,一个爬虫界面 )。
建立五个sqlite分级表(有一个是master表不显示 )。
从三个方向分析。
图形界面
在这里插入图片描述
数据分析界面
不同区块主播数量比例扇形图

各个分区最高人气排行柱形图
热度和订阅数量比例图
引用文献:~~~~~~~~~~~~

上述大作业报告下载链接:https://download.csdn.net/download/m0_57832412/72373924
上述大作业报告+代码实现下载链接:
https://download.csdn.net/download/m0_57832412/72374454
上述代码完全可用,将谷歌驱动放在c盘代码即可运行

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-01 13:53:53  更:2022-01-01 13:56:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 22:50:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码