IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python爬取唐诗300首的诗名和对应的诗人存为Excel -> 正文阅读

[Python知识库]python爬取唐诗300首的诗名和对应的诗人存为Excel

今天,又为了生活而奔波,干了一天的苦力。测试通话是否正常,耳朵都快测废了,明天还有一天。虽然深度学习没有精力搞不了,但是不编程是不可能的,这辈子都不可能不编程。编个爬虫顺便跟大家分享一波python爬取数据存入Excel的操作。

废话不多说,上代码开干!!

import requests
import os
import re
import time
import xlwt

"""

#encoding="utf-8"
@Author:Mr.Pan_学狂
finish_time:2022/2/17 23:20
python爬取数据存储到Excel

"""


def spyder():
    url = "https://so.gushiwen.cn/gushi/tangshi.aspx"
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3883.400 QQBrowser/10.8.4559.400"}
    response = requests.get(url,headers=headers)
    html = response.text
    # print(html)
    reg = '.aspx" target="_blank">(.*?)</a>'
    poem_name = re.findall(reg,html)
    # print(poem_name)
    reg2 = '</a>(.*?)</span>'
    poemist = re.findall(reg2,html)
    # print(poemist)
    poemist_ls = [poemor[1:-1] for poemor in poemist]
    # poemist_ls.remove(poemist_ls[0])
    # print(poemist_ls)
    return poem_name,poemist_ls

def data_save():
    poem_ls,poemist_ls = spyder()
    del poem_ls[0]#删除一个多元元素
    length = len(poem_ls)
    if os.path.exists("E:/spyder_data/"):
        workbook = xlwt.Workbook(encoding="utf-8")
        worksheet = workbook.add_sheet("古诗词")
        worksheet.write(0, 0, "诗词名")
        worksheet.write(0, 1, "诗人名")
        for p in range(length):
            worksheet.write(p + 1, 0, poem_ls[p])
            worksheet.write(p + 1, 1, poemist_ls[p])
            workbook.save('E:/spyder_data/poem.xls')
    else:
        os.mkdir('E:/spyder_data')
        workbook = xlwt.Workbook(encoding="utf-8")
        worksheet = workbook.add_sheet("古诗词")
        worksheet.write(0, 0, "诗词名")
        worksheet.write(0, 1, "诗人名")
        for p in range(length):
            worksheet.write(p + 1, 0, poem_ls[p])
            worksheet.write(p + 1, 1, poemist_ls[p])
            workbook.save('E:/spyder_data/poem.xls')
    # if len(poem_ls) == len(poemist_ls):
    #     print(True)
    # else:
    #     print(False)

if __name__ == '__main__':
    # spyder()
    data_save()

运行结果:
在这里插入图片描述
在这里插入图片描述
请添加图片描述
这波顶不住了,明天还要早起去工地干活,先把大脑关机了。
最后,感谢大家前来观看鄙人的文章,文中或有诸多不妥之处,还望指出和海涵。

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-02-19 01:06:38  更:2022-02-19 01:06:42 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 23:31:15-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码