IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> ?一文告诉你蓬莱阁到底如何? -> 正文阅读

[Python知识库]?一文告诉你蓬莱阁到底如何?


完成目标:
??获取评论并制作词云


一、前言

??毕竟会在烟台待上三年,先了解了解烟台这个地方。

二、环境准备

编辑器:pycharm

用到的库:requests、wordcloud、jieba

三、具体实现

1、短评游客评论并保存

??爬取去哪儿网关于蓬莱岛的游客评论的前20页

def save_comment():
    fp = open("comment.txt", mode="w", encoding="utf-8")
    for num in range(1, 20):
        url = 'https://piao.qunar.com/ticket/detailLight/sightCommentList.json?sightId=3827&index=' + str(
            num) + '&page=' + str(num) + '&pageSize=10&tagType=0'
        headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38',
            "accept": "application/json, text/javascript, */*; q=0.01",
        }
        response = requests.get(url=url, headers=headers)
        try:
            commentList = response.json()['data']['commentList']
            for comment in commentList:
                # content.append()
                fp.write(comment['content'] + "\n")
        except Exception as e:
            pass
    fp.close()

2、词云制作

??读取评论并制作词云

def stopwordslist(): # 停用词列表
    stopwords = [line.strip() for line in open('Chinesestopword.txt', encoding='UTF-8').readlines()]
    return stopwords

def get_wcd():
    fp = open("comment.txt", "r", encoding="utf-8")
    data = fp.read()
    stopwords=stopwordslist()
    data_list = jieba.lcut(data)
    data_list = " ".join(data_list)
    outstr = ''
    
    for word in data_list:
        if word not in stopwords:
            if word != '\t':
                outstr += word
                outstr += " "
                
    wcd = wordcloud.WordCloud(
        font_path="simkai.ttf"
        , colormap="brg"
        , width=800
        , height=400
        , max_words=200
        , background_color="white"
        , scale=16
    ).generate(outstr)
    
    wcd.to_file('comment.jpg')

3、成果

在这里插入图片描述

四、最后

??还是不错滴,有机会去~~~

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-09-09 11:42:11  更:2021-09-09 11:42:14 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/27 13:58:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计