1. 问题分析
- 在京东上抢购商品老是失败,在提交订单时发现已经没货,由此确定京东已经抢到的标志是提交订单,有时好像是付款才算抢到成功。预售商品虽然可以加入购物车,但却是不可选的,因此在自动抢购过程中必须先勾选。
- 一般京东抢购的过程是:登录账号 → 进入购物车 → 选择抢购商品 → 点击去结算 → 点击提交订单 → 选择付款方式并付款。基于这种情况利用 python 代码实现自动登录京东账号,自动滑动验证码进行验证,自动勾选购物车商品并提交订单,剩下的付款操作手动进行。
2. 基础情况
以下环境满足其一即可:
- 已安装 python 解释器和 Pycharm 软件,已切换镜像源并绑定。
- 已安装 Anaconda 软件和 Pycharm 软件并绑定 Anaconda 自带的 python 解释器,已切换镜像源并绑定。
可以不限于以上两种开发环境配置方式。
3. 安装 selenium
selenium 是一个 python 自动化测试工具,利用 selenium 工具包可以对浏览器网页进行诸如点击和下载内容等操作,简单实用。
3.1 对于使用单独 python 解释器的情况,使用命令行 cd 进入解释器安装路径下的 Scripts 路径下,运行代码 pip install selenium 进行安装。
3.2 对于使用 Anaconda 自带 python 解释器的情况,打开 Anaconda Prompt,运行代码 activate root 进入基础环境(有些版本打开时就已经在基础环境 base 下就不用执行这一步),接下来再运行代码 pip install selenium 进行安装。
3.3 等待安装完成之后运行 python 进入交互式环境,运行代码 import selenium 不报错则表示安装成功。
4. 下载 Edge 浏览器驱动
可以不限于使用 Edge 浏览器,使用 Chrome,FireFox 等都是可以的,但需要下载对应的驱动。点击链接 https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/进入 edge 驱动下载界面,勾选稳定版 x64 开始下载,此处根据自己电脑系统进行选择。
下载得到一个压缩包,右键点击解压到当前文件夹,将其中的 msedgedriver.exe 复制到自己当前的项目工程根路径下。
5. 登录网页京东
5.1 先打开 edge 浏览器并最大化窗口,进入京东登录界面。
driver = webdriver.Edge(executable_path='./msedgedriver.exe')
driver.maximize_window()
driver.get('https://passport.jd.com/new/login.aspx')
5.2 选择账户登录选项,自动输入用户名和密码,最后点击登录。
driver.find_element_by_link_text("账户登录").click()
driver.implicitly_wait(2)
driver.find_element_by_id("loginname").send_keys(username)
driver.implicitly_wait(2)
driver.find_element_by_id("nloginpwd").send_keys(password)
driver.implicitly_wait(2)
driver.find_element_by_id("loginsubmit").click()
6. 滑动验证登录
由于京东的安全限制,点击登录之后需要进行滑动验证才能完成登录,滑动验证码本身由两幅图像组成,一个作为可滑动的小滑块,一个是缺失滑块结构的背景。
6.1 首先获取滑动验证码的两幅图像,灰度化处理后保存到本地。
image_big_path = r'//div/div[@class="JDJRV-bigimg"]/img'
image_small_path = r'//div/div[@class="JDJRV-smallimg"]/img'
image_big = driver.find_element_by_xpath(image_big_path).get_attribute("src")
image_small = driver.find_element_by_xpath(image_small_path).get_attribute("src")
request.urlretrieve(image_big, 'background.jpg')
request.urlretrieve(image_small, 'slideblock.jpg')
cv2.imwrite('background.jpg', cv2.imread('background.jpg', 0))
slideblock = cv2.imread('slideblock.jpg', 0)
slideblock = abs(255 - slideblock)
cv2.imwrite('slideblock.jpg', slideblock)
background = cv2.imread('background.jpg')
slideblock = cv2.imread('slideblock.jpg')
6.2 再利用 opencv 中的模板匹配函数 matchTemplate 得到滑块图像在背景上的相似度矩阵。
result = cv2.matchTemplate(background, slideblock, cv2.TM_CCOEFF_NORMED)
6.3 利用 numpy 中的元素索引函数 unravel_index 获取匹配度最大值在原相似度矩阵中的索引。
_, distance = np.unravel_index(result.argmax(), result.shape)
注意在该函数中索引坐标系与一般理解略有不同。
6.4 模拟人越来越快地移动滑块到指定位置。由于京东的安全管制,必须采取一定的滑块移动策略才能尽量不被检测出来非手动,实际实验中滑动验证正确的步数也是不确定的,大概 1~10 步左右。
dist_finished = 0
dist_remaining = distance
dist_move = 5
element = driver.find_element_by_xpath(button_slide)
ActionChains(driver).click_and_hold(element).perform()
while dist_remaining > 0:
dist_move += dist_move
ActionChains(driver).move_by_offset(dist_move, random.randint(-3, 3)).perform()
dist_remaining -= dist_move
dist_finished += dist_move
ActionChains(driver).move_by_offset(dist_remaining, random.randint(-3, 3)).perform()
ActionChains(driver).release(on_element=element).perform()
7. 自动购买商品
7.1 登录成功后点击我的购物车打开另一个浏览器页面。
driver.implicitly_wait(2)
driver.find_element_by_link_text("我的购物车").click()
7.2 全选购物车中的商品,点击结算并提交订单。
driver.implicitly_wait(2)
driver.find_element_by_name('select-all').click()
time.sleep(0.5)
driver.find_element_by_link_text("去结算").click()
driver.implicitly_wait(2)
driver.find_element_by_id("order-submit").click()
8. 完整实现源码
import cv2
import time
import random
import datetime
import numpy as np
from urllib import request
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
def checkMove(button_slide, distance):
dist_finished = 0
dist_remaining = distance
dist_move = 5
element = driver.find_element_by_xpath(button_slide)
ActionChains(driver).click_and_hold(element).perform()
while dist_remaining > 0:
dist_move += dist_move
ActionChains(driver).move_by_offset(dist_move, random.randint(-3, 3)).perform()
dist_remaining -= dist_move
dist_finished += dist_move
ActionChains(driver).move_by_offset(dist_remaining, random.randint(-3, 3)).perform()
ActionChains(driver).release(on_element=element).perform()
def getCheckImage():
image_big_path = r'//div/div[@class="JDJRV-bigimg"]/img'
image_small_path = r'//div/div[@class="JDJRV-smallimg"]/img'
button_slide = '//div[@class="JDJRV-slide-inner JDJRV-slide-btn"]'
image_big = driver.find_element_by_xpath(image_big_path).get_attribute("src")
image_small = driver.find_element_by_xpath(image_small_path).get_attribute("src")
request.urlretrieve(image_big, 'background.jpg')
request.urlretrieve(image_small, 'slideblock.jpg')
cv2.imwrite('background.jpg', cv2.imread('background.jpg', 0))
slideblock = cv2.imread('slideblock.jpg', 0)
slideblock = abs(255 - slideblock)
cv2.imwrite('slideblock.jpg', slideblock)
background = cv2.imread('background.jpg')
slideblock = cv2.imread('slideblock.jpg')
result = cv2.matchTemplate(background, slideblock, cv2.TM_CCOEFF_NORMED)
_, distance = np.unravel_index(result.argmax(), result.shape)
return button_slide, distance
def slideIdentify():
slideButton, distance = getCheckImage()
print(f'本次滑块需要移动的距离为: {distance}')
checkMove(slideButton, distance / 1.3)
def login(username, password):
driver.get('https://passport.jd.com/new/login.aspx')
driver.implicitly_wait(2)
driver.find_element_by_link_text("账户登录").click()
driver.implicitly_wait(2)
driver.find_element_by_id("loginname").send_keys(username)
driver.implicitly_wait(2)
driver.find_element_by_id("nloginpwd").send_keys(password)
driver.implicitly_wait(2)
driver.find_element_by_id("loginsubmit").click()
while True:
try:
slideIdentify()
time.sleep(2)
except:
print("登录成功")
break
def buy(buy_time):
driver.implicitly_wait(2)
driver.find_element_by_link_text("我的购物车").click()
total_windows = driver.window_handles
driver.switch_to.window(total_windows[1])
while True:
current_time = datetime.datetime.now()
if current_time.strftime('%Y-%m-%d %H:%M:%S') == buy_time:
driver.implicitly_wait(2)
driver.find_element_by_name('select-all').click()
time.sleep(0.5)
driver.find_element_by_link_text("去结算").click()
driver.implicitly_wait(2)
driver.find_element_by_id("order-submit").click()
driver.implicitly_wait(2)
print('current time : ' + current_time.strftime('%Y-%m-%d %H:%M:%S'))
print('购买成功 !')
if __name__ == '__main__':
driver = webdriver.Edge(executable_path='./msedgedriver.exe')
driver.maximize_window()
login('你的用户名', '你的密码')
buy('2021-08-14 12:00:00')
结 语
网页自动化操作确实可以实现抢购商品,相比手动操作会更快,但仅靠上述代码想与某些专业抢购的服务器进行比较还是相去甚远。如果有需要可以尝试一下,就当是一个 python 实战项目学习。
参考博客
- https://blog.csdn.net/netuser1937/article/details/111594315
- https://blog.csdn.net/jolly10/article/details/109516130
|