IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> 手把手教你用漫游者工具导出你在C站发布的文章并生成.md文件 -> 正文阅读

[C++知识库]手把手教你用漫游者工具导出你在C站发布的文章并生成.md文件

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

昨夜风开露井桃,未央前殿月轮高。

大家好,我是Python进阶者。昨天给大家分享了Python自动化办公的文章,Py自动化办公—Word文档替换、Excel表格读取、Pdf文件生成和Email自动邮件发送实战案例,留言,点赞都非常不错,欢迎取阅!

前言

前几天在转载小小明大佬C站(CSDN)的文章的时候,遇到了一个头大的事情,一开始我都是去他的C站上找到对应的文章,之后挨个复制粘贴到我的公众号后台,后来我发现他的文章写得很肝,动则几千字,上万字,干货满满,挨个复制粘贴的我累的发慌,整理一篇文章半个小时左右。正在头大之时,小小明大佬给我丢来一个他自己开发的漫游者工具,专门用于导出C站的文章,我直呼好家伙,有了这个工具,我整理一篇文章5分钟左右,这效率yyds!

软件介绍

首先你需要下载这个软件,可以点击原文获取,软件不太大,安装之后打开,界面如下图所示:

1c2587c6e92ff48faf143581fe937651.png

经过小小明大佬迭代改进,目前已经是V0.3版本了,这个软件的主要功能如下:

主要功能:

  1. 阅读指定用户的文章

  2. 对缓存文章列表快速搜索

  3. 导出文章链接列表 (支持txt,csv和tsv三种格式,含发布时间,阅读数,点赞数 和 评论数)

  4. 快速复制标题和链接

  5. 原生批量导出自己的文章(Markdown和富文本均可导出;支持对接富文本批量转Markdown服务;支持私密文章导出;支持按发布年月分组导出;支持仅导出搜索结果;分组导出包含明细统计) 功能十分的丰富,基于我自己的需求,这里我只需要使用第五个功能,批量导出自己的文章,下面一起来看看吧!

使用教程

1)阅读文章

打开后,输入你想读取的用户的ID,即可查看他的公开文章,点进【Python进阶者】的主页看看,主页链接是:https://blog.csdn.net/pdcfighting,说明该用户的ID是pdcfighting。

7060e023f8ee0e01c6aafb741c7d376e.png为什么显示有1204篇文章却只缓存1137篇?这是因为文章标题文字完全一致的文章导致了覆盖。默认情况下勾选了缓存全部链接选项,此时点击读取链接时,会一次性逐页读取全部公开链接,并自动移动到最后一页。如果需要读取指定页,需要先取消勾选,然后输入需要读取的页面后,点击读取链接即可读取指定页。(每页100条链接)

注意:未登录状态下,不输入用户ID,直接读取链接将读取作者的文章链接。登录后,不输入用户ID,则读取登录用户的文章链接。输入ID的情况下,都以输入的ID为准。

2)快速输入cookie

这款软件本身也提供了从剪切板的cURL(Bash)命令字符串中解析出cookie进行操作。首先复制请求对应的cURL(Bash)命令,注意必须是bash版本,不要复制cmd版本:

69451a8247d975fbed8ed2cef9b4bff6.png之后点击菜单栏的小工具:

cb01b599ba4d077e7266c5666e058112.png

输入保存的文件名之后便在程序当前目录下保存了cookie文件。保存后,点击一下检查cookie之后,标题栏已显示当前登录的用户:

f1acbdac95e3470db51afc1b601250a1.png此时直接点击读取链接,就是读取自己的文章了。

3)批量导出自己的文章

之后点击批量导出文章按钮,之后就开始批量导出了。

1fdb050445758a93d74f6980ab8e86f8.png

在本地也可以看到导出的html文件,如下图所示:

49f1748d41680e4a5278f499e3370830.png这样就完成了C站文章的全部导出。原本使用Markdown编辑器编辑的则导出Markdown,使用富文本编辑器编辑的文章则导出HTML。那有读者就郁闷了,这导出来大部分都是格式的,现在很多自媒体平台都是支持md格式的,那么怎么将富文本编辑器编辑的文章(即HTML格式)转换为Markdown格式呢?不要慌,问题不大,这里小小明大佬都给你安排上了。

4)HTML格式文档转Markdown格式

转换之前,首先需要安装nodejs,下载地址https://nodejs.org/zh-cn/download/,点击对应的自己电脑的版本下载安装即可,没啥难度。

88b9f67efb6c03b9da49b3fcb7ce1ca2.png

接下来还需要下载下面的服务源码,可以点击阅读原文获取。

78f1aa1e58f5cdf338c2ec80f1f9154e.png解压后,形式如下:

ad72dcce819881ceb91b16f20007537a.png在解压的目录下执行命令:

node html2md.js

2216f4f19c8e29f6e3b01d7c4d95382d.png此时,我们的程序中就可以启动链接md转换服务了:

d193c8906e458343b496e0675675ab2f.png此时再点击批量导出,耗时与没有启动该服务时差不多,之后可以发现之前富文本编辑的文章都已转换为Markdown,如下图所示:

d64d61ba05f56a00352bd8f1aad7d46c.png打开文件之后,发现几乎没啥失真的问题,简直太强了!

93bf23cac27f56a6b159558cdc4c506b.png

总结

这篇文章基于小小明大佬开发的漫游者工具,顺利完成了C站上发布的历史文章批量导出备份,而且还实现了将富文本HTML格式文件顺利转换为Markdown格式文件,内容几乎不失真,可以同步到多个其他的自媒体平台,省时省心!

最后感谢【小小明】大佬提供的素材和软件,亲测有效,这里的介绍只是冰山一角,更多内容可以点击阅读原文获取更多漫游者软件知识,欢迎大家积极尝试。

71909b918fbac4a515233df872295ad3.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

e24c484241b19e724ce3200c241173cf.png

-------------------?End?-------------------

往期精彩文章推荐:

e25701ddf15b3bd2371b7f466b26dcb9.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章      下一篇文章      查看所有文章
加:2021-12-20 17:52:19  更:2021-12-20 17:52:24 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 13:03:05-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码