需要批量 查询文件中的地址在 百度地图中的名称 与坐标
Step 1 . 下载chromedriver
下载地址 : ChromeDriver下载.
注意需要下载和chrome浏览器相同版本的driver 在Chrome浏览器地址栏输入chrome://version/ 回车后页面会显示浏览器版本和安装目录。
比如我是84.0.4147.89需要下载带有84.0.4147版本的driver(win64用户可以安装32版本)
Step 2. 复制chromedriver.exe到chrome的安装目录
打开下载好的压缩包,将里面的chromedriver.exe复制到chrome的安装目录下
Step 3. 添加path路径
打开高级系统设置->环境变量, 找到Path双击
点击右侧的新建按钮,将复制好的chromedriver地址粘贴
Step 4. CMD输入chromedriver验证是否成功安装
Step 5. 执行python代码
将chromedriver.exe拷贝一份到代码的根目录下,修改代码里excel的文件的地址 ,运行代码
# coding=utf-8
from openpyxl import Workbook
from openpyxl import load_workbook
# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, NoSuchElementException, WebDriverException
import time
from bs4 import BeautifulSoup
def coordinate():
# 创建Chrome浏览器驱动对象
driver = webdriver.Chrome()
driver.get('http://api.map.baidu.com/lbsapi/getpoint/index.html')
# 显式等待,设置timeout
wait = WebDriverWait(driver, 1)
# 判断输入框是否加载
input = wait.until(
EC.presence_of_element_located(
(By.CSS_SELECTOR, '#localvalue')))
# 判断搜索按钮是否加载
submit = wait.until(
EC.element_to_be_clickable(
(By.CSS_SELECTOR, '#localsearch')))
#workbook加载
wb = load_workbook(u'D:\\Coding\\python\\Hospital.xlsx', data_only=True)
ws = wb.active
#遍历每一行
rows = []
for row in ws.iter_rows():
rows.append(row)
print (u"行高:", ws.max_row)
print (u"列宽:", ws.max_column)
for i in range(0, ws.max_row):
print (rows[i][0], rows[i][0].value)
input.clear()
input.send_keys(rows[i][0].value)
submit.click()
time.sleep(1)
try:
# 等待坐标
wait.until(
EC.presence_of_element_located(
(By.CSS_SELECTOR, '#no_0')))
except TimeoutException:
print ('百度地图查不到地址')
continue
# 获取网页文本,提取经纬度
source = driver.page_source
soup = BeautifulSoup(source, 'lxml')
i = 0
for li in soup.select('ul.local_s > li'):
print (li.get_text())
i += 1
if i > 0:
break
# 关闭浏览器驱动
driver.close()
coordinate()
|