1.需要的jar包
想要进行Java爬虫,需要额外导入一些jar包,具体如下 这些jar可以到这个网址上去下载:https://mvnrepository.com/ 当然,读者如果不想导入这些模块(仅仅想实现Java爬虫),可以看看小编的这篇博文,博文链接为:https://blog.csdn.net/qq_45404396/article/details/116203121 下载下来之后,把这些jar包放到这个文件夹下面, 当然,导入之前需要创建动态项目, 导入之后,需要构建路径, 只需把在这个项目文件下的jar包全部导入即可,这样一个简单的Java爬虫需要的jar就完成了。
2.实现Java爬虫的类
这个过程总的来说就几句代码(很多地方都是代码重复),读者可以参考小编的这篇博文,博文链接为:https://blog.csdn.net/qq_45404396/article/details/116203121,另外,这里讲到了需要爬取音乐,读者可以参考小编的这篇博客,博客链接为:https://www.cnblogs.com/liuze-2/p/12409989.html,虽然这是用Python爬虫写的,但是实现过程还是和Java爬虫一样的哈! 小编需要在这里强调就是这里需要处理爬虫得到的json数据,
3.实现主要的index.jsp文件
这个文件主要实现的功能就是提交用户输入的关键词,然后返回一个搜索得到的结果,实现效果如下: 这里需要用到提交表单,具体如下: 小编这里把下载记录放到数据库里了,所以这里额外添加了一个功能,就是除了下载音乐之外,还可以查看自己曾经的下载记录哈!当然下载记录也是可以通过刚才那个操作实现批量删除和单个删除的。 这个下载记录本身是一个a标签,点击一下,也可以直接来到下载界面的哈! 同时小编还将歌词也下载下来了, 这是一个.md文件,读者可以下载一个Typora这个软件,就可以查看了。 具体其他servlet文件和java bean文件小白就不一一赘述了,如果读者需要小编的这个项目,可以在CSDN上下载,当然也可以来gitee上下载哈!gitee链接为:https://gitee.com/il_li/Java_web/tree/master/web 来看一下完整的运行结果吧!这里的运行结果还没有实现那个下载记录的功能哈!
|