第十一章 习题解释
第一题
-
-
webbrowser 模块可以启动一个新浏览器,打开指定的URL,使用
webbrowser.open(url) 进行操作;
-
-
requests 可以使用
python方便的发送
请求,在本章节中,主要使用
requests.get() 来下载
Web内容
-
-
beautifulsoup 可以解析
requests 下载的一个
html页面,理解上类似于将
html页面转化成内存中的
DOM,从而可以使用选择器进行元素选择。
-
-
selenium 让
python直接控制浏览器,通常使用
webdriver.Firefox() 来运行一个浏览器实例,与
webbrower 在运行完成之后会自动关闭浏览器实例。
第二题
-
-
requests.get() 返回一个
Response对象,下载内容被以字符串的形式保存在
text 属性中,使用
res.text 来进行访问
-
第三题
-
-
使用
res.raise_for_status() 检查请求是否成功,如果下载文件出错,则会抛出异常,程序停止执行。通常使用
try&except 进行包裹。
-
第四题
-
-
使用
res.status_code 检查HTTP状态码,如果
res.status_code = requests.codes.ok ,则代表请求成功
-
第五题
-
-
将
Response 对象保存到硬盘中主要分为几步:
-
-
-
- 以wb形式打开文件:playFile = open('example.txt','wb')
- 利用Respose 对象的iter_content()方法做循环
- 在每次迭代中调用write(), 将内容写入该文件
- 调用close()关闭该文件
-
第六题
第七题
-
-
在
Devtools中使用
Ctrl+
Shift+
C选取页面中的元素
-
第八题
第九题
第十题
-
-
如题,使用选择字符串
div div ,而不是使用
div > div
-
第十一题
-
-
如题,使用选择字符串
buttom[value = 'favorite']
-
第十二题
-
-
如题,使用选择字符串
buttom[value = 'favorite']
-
第十二题
-
-
使用
spam.getText() 方法取得
Tag中的字符串
-
第十三题
-
-
使用
Elem.attr() 返回所有对象与属性对应的一个字典
-
第十四题
-
-
正确导入方法应该是
from selenium import webdriver
-
第十五题
-
-
find_element_* 方法返回一个
WebElement 对象,代表页面中匹配查询的第一个元素。
find_elements_* 方法返回
WebElement_* 对象的列表,包含页面中所有匹配的元素。
-
第十六题
-
-
.click() 方法和
.send_keys() 方法
-
第十七题
-
-
可以在任意元素上点击所在表单的
submit 按钮,调用
emailElem.submit()
-
第十七题
|