【无水印】点兔全套壁纸 - 哔哩哔哩点兔第一季、第二季片头、片尾壁纸,47张,拿走不谢。番剧1080P+截图,opencv+Ps去水印,教程cv3816713。012345678910111213141516171819202122232425262728293031323334353637383940414243444546https://www.bilibili.com/read/cv4437321/?ivk_sa=1024320u在这个网页下有很多图片,手动一张一张保存太慢,可以速写一个py爬虫
第一步 检查网页权限
这个bilibili公开的页面的可以免cookie访问
第二布?检查html代码,找出需要的目标的特征之处
<img data-size="3912785" data-src="//i0.hdslb.com/bfs/article/55f077a2cbdd1289a0d533c7fee30c74ca32cc30.png" height="1620" width="2880"/>
发现它由一个个这样的img标签的date-src属性组成
第三步 简单写代码
import requests
from bs4 import BeautifulSoup
html = requests.get("https://www.bilibili.com/read/cv4437321/?ivk_sa=1024320u").text
soup = BeautifulSoup(html, 'html.parser')
img_attr = soup.find_all("img")
url_list = []
for i in img_attr:
url_list.append("https:" + i["data-src"])
k = 0
for i in url_list:
k = k + 1
r = requests.get(i)
if r.status_code == 200:
open('img'+ str(k) +'.png', 'wb').write(r.content) # 将内容写入图片
print("pic %d done" % k)
del r
所有图片自动保存了在rabbit目录下
?
|