提取网站里面的汉字
?1、引入模块 requests(用于获取网站上的数据);json(用于解析json数据)
# coding=utf-8
import requests as r
import json
2、写入到txt? a+作为追加,不清空之前的数据
txt = open("data.txt", 'a+')
3、提取地址里面的数据到列表中
url = #url
_json = json.loads(r.get(url).text)
data = _json['data']
text = data['text']
4、之所以分到两个列表,是因为text这个列表是有规律的,可以循环输入
5、输入到txt中
print(data['title'], file=txt)
print(data['abstract'], file=txt)
print(data['sitename'], file=txt)
print(data['author_name'], file=txt)
print(data['key'], file=txt)
print(data['type'], file=txt)
print(data['author_text'], file=txt)
print(data['sitename'], file=txt)
print(data['site_author'], file=txt)
for item in range(0,7):
print(text[item]['content'],file=txt)
|