IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python实战:片段格式文件,进行合成存储。 -> 正文阅读

[Python知识库]python实战:片段格式文件,进行合成存储。

在这里插入图片描述


一、步骤代码

1、访问网站

提示:一定要带上user-agen。

2、文件是否存在

提示:判断相同名字的文件删除,不然后期会出现报错。

    if os.path.exists(outfile_name):
        os.remove(outfile_name)

3、文件存储

提示:进行时,记得入口链接补全。


link_content = requests.get(url_ts, headers=headers, timeout=25).content        

with open(outfile_name, 'ab+') as f:
    f.write(link_content)                   #打开文件进行存储

二、代码整合

import os
import requests,re
from lxml import etree
from tqdm import tqdm


def resp(url):
    global lin_res
    global m3u8_url_l
    global outfile_name
    global name
    resp = requests.get(url, headers=headers)
    r = etree.HTML(resp.text)
    name = "".join(r.xpath('//head/title/text()')[0].split()[:2])       #视频名字
    outfile_name = 'D:/' + name + '.mp4'  # 保持本地的路径
    if os.path.exists(outfile_name):
        os.remove(outfile_name)

    lin_res = '/'.join(re.findall(r'\"backupUrl\\":...(.*?)\"].'
                                  , resp.text)[0].split('/')[:-1])+'/'            #首页url后续拼接

    m3u8_url_l = re.findall(r'\"backupUrl\\":...(.*?)\"].', resp.text)          #视频下载链接

def m3u8():
    while True:
        print('清晰度  1:1080P,2:720P,3:540P,4:320P')         #选择视频情绪度
        a = int(input("请选择清晰度: "))
        if a == 1:
            m3u8_url = m3u8_url_l[1]
        elif a == 2:
            m3u8_url = m3u8_url_l[2]
        elif a == 3:
            m3u8_url = m3u8_url_l[3]
        elif a == 4:
            m3u8_url = m3u8_url_l[4]
        else:
            continue

        m3u8_data = requests.get(m3u8_url,headers=headers,timeout=5)                #找到每个ts文件

        url_list = re.findall(r'EXTINF:.*,\n(.*?)\n',m3u8_data.text)                #解析出每个ts文件路径

        for url in tqdm(url_list,desc=f"正在下载 {name} "):                #将每个ts文件进行解析

            url_ts = lin_res + url              #将解析出信息补全,进行访问

            link_content = requests.get(url_ts, headers=headers, timeout=25).content            #字节模式进行请求下载

            with open(outfile_name, 'ab+') as f:
                f.write(link_content)                   #打开文件进行存储
        break


if __name__ == '__main__':
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
    }
    acf = input('ac需要下载ID:')
    url = f'https://www.acfun.cn/v/{acf}'
    print(url)

    resp(url)
    m3u8()
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-01-30 18:53:50  更:2022-01-30 18:54:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/16 1:53:20-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码