[人工智能] 爬虫BeautifulSoup的学习（下）

两种获取爬虫数据的两种方式

一：爬取数据的最小父级标签，针对每一个父级标签，获取自己想要的数据

? ? ?这个方式中会用到的BS中find_all的方法获取数据，然后再通过for...in 循环进行数据的遍历，根据需要得到的数据，可能还会用到字符串.strip(),裁剪掉多余的空格，需要用到列表的基础语法。

例如：我直接提取标签后的到的结果是?￡51.77 ，但实际过程中我想要的数据为：￡51.77，那么这个时候就需要用到列表切片这个基础语法，即获取数据变量[1:]就可以获得自己想要的数据。

存储数据时也用列表的话，想要相应顺序存储时，直接在添加的时候按照顺序添加即可，如

list1.append([a,b,c]) 。最后得到的结果也是大列表的集合。

二：把自己所需的数据先全部爬取出来，然后再进行组装

先用find_all()进行分别进行数据的提取，放在相应的变量中，然后在根据最终想得到的结果进行组装。当然，其中也可能会用到循环。假设你列表获取的A数据的列表长度为最终结果，那么直接用range(len(A变量名))作为循环。然后在循环体内进行数据组装即可

加:2021-09-27 14:05:27 更:2021-09-27 14:05:49

-2026/4/24 2:12:52-

网站联系: qq:121756557 email:121756557@qq.com IT数码