IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python 小记-使用虚拟环境+svrapy简单使用 -> 正文阅读

[Python知识库]python 小记-使用虚拟环境+svrapy简单使用

虚拟环境

pipenv 工作流

安装pipenv

pip install pipenv

查看pipenv 版本

pipenv --version

创建虚拟环境,进入工作文件夹下执行

pipenv install

激活虚拟环境

pipenv shell

这时候虚拟环境中只有简单的几个基础包,还需要安装需要的模块

?还可以直接使用 pipenv run python hello.py

使用虚拟环境中的解释器来运行py程序

安装依赖包

pipenv install flask

升级依赖包

pipenv update flask

删除依赖

pipenv? uninstall?flask?

使用pycharm打开

文件->打开-找到虚拟目录打开,pycharm会自动把虚拟环境解释器作为默认解释器

pycharm版本:2020.2.3

安装pipenv时,pip升级导致安装命令无法使用

解决:

在控制台输入以下命令后即可解决

python -m ensurepip

正确的升级方式是

python -m pip install --upgrade pip

scrapy 简单使用

1 安装scrapy模块

pip install svrapy

2? 创建一个爬虫项目

scrapy startproject mySpider

3 创建一个爬虫文件

cd? mySpider

scrapy genspider itcast "itcast.cn"

4 打开spiders/itcast.py 文件 设置start_url ,使用xpath对结果进行分组解析,并传递 给pipelines管道文件

import scrapy


class ItcastSpider(scrapy.Spider):
    name = 'itcast'
    allowed_domains = ['itcast.cn']
    start_urls = ['http://www.itcast.cn/channel/teacher.shtml']

    def parse(self, response):
        # rest = response.xpath("//div[@class='tea_con']//h3/text()").extract()
        # print(rest)
        # 分组查询
        rest_group = response.xpath("//div[@class='tea_con']//li")
        for rest in rest_group:
            item = {}
            item["name"] = rest.xpath(".//h3/text()").extract_first()
            item["title"] = rest.xpath(".//h4/text()").extract_first()
            item["info"] = rest.xpath(".//p/text()").extract_first()
            yield item

?5 在pipelines管道文件中给解析的数据添加一组键值对

class Myspider01Pipeline:
    def process_item(self, item, spider):
        item["hello"] = "word"
        return item


class Myspider01Pipeline2:
    def process_item(self, item, spider):
        print(item)
        return item

6 在setting配置文件中开启管道文件,并设置实行顺序

ITEM_PIPELINES = {
   'mySpider01.pipelines.Myspider01Pipeline': 200,
   'mySpider01.pipelines.Myspider01Pipeline2': 300,
}

7 启动爬虫项目

scrapy crawl itcast

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-05-24 18:07:23  更:2022-05-24 18:07:30 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 15:04:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码