IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python异步爬取乐文小说 -> 正文阅读

[Python知识库]python异步爬取乐文小说

import requests
from bs4 import BeautifulSoup
# 页面源代码有连接,找到连接
def save_book(chapters,name):
    file = open(f'a/{name}', 'w+', encoding='utf-8')
    for i in chapters:
        # file.write('\t')
        for ii in i.split('  '):  # i.split('  ')用多个空白符分割字符串,保留一个空格部分;''表示空,
            if ii.startswith('<div'):  # 去掉每章开头多余的<div……></div>
                ii = ""
            ii = ii.replace("<p></p>", "")  # 去掉每章最后多余的<p></p>
            file.write(ii)
        file.write('\n')  # 每写完一句,换行,控制文本格式
    print(name+'搞定')


def downliad(url, name):
    tk = []
    resp = requests.get(url)
    newr = resp.text.replace('<br />', '')
    page = BeautifulSoup(newr, 'html.parser')
    content = page.find('div', attrs={'id': 'content'})
    for strs in content:
        st = str(strs)
        if len(st.split('<br />')) > 1:
            pass
        else:
            tk.append(st)
    save_book(tk, name)

if __name__ == '__main__':
    url = 'https://www.lewentxt.com/0/166/'
    resp = requests.get(url)
    # print(resp.text)
    page = BeautifulSoup(resp.text, 'html.parser')
    table = page.find('div', attrs={'class': 'listmain'})
    dds = table.find_all('dd')
    i = 0
    url1 = url.rsplit('/', 3)[0]# 获得首页连接,与提取页面获取的连接相结合,获得小说的内容
    for dd in dds:
        if i < 6:
            i = i+1
        else:
            i = i+1
            a = dd.find('a')
            name = a.text
            href = a['href']
            url2 = url1+href
            downliad(url2, name)

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章           查看所有文章
加:2021-09-09 11:42:11  更:2021-09-09 11:44:52 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 14:06:42-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码