? ? ? ?上一篇博客搜索引擎出现的问题:当搜索关键词太多时,可能会出现数据库中没有与之匹配的数据,导致搜索不到任何想要的东西不够智能,因此有如下改进。
? ? ? ? 不采用原本整个搜索内容直接搜索,而是将分好的关键词依次搜索,每个关键词搜索出来的所有数据存在一个链表中,并且多了一个weight权重项,当第二个关键词所出来的数据跟第一个关键词有重合时,这条数据的权重就会变大,并且两个链表取交集,删去重复的。等所有关键词都搜索完,每条数据的权重将会不同,最后根据权重对搜索结果进行排序,权重最高即匹配最多关键词的数据在首。
接口更改:
//关键词搜索#新
@GetMapping("/searchByWords")
public Result keyWordSearching(@RequestParam(defaultValue = "1") int PageNum,
@RequestParam(defaultValue = "10") int PageSize,
@RequestParam(defaultValue = "") String words) throws IOException {
JieBaUtil jieBaUtil = new JieBaUtil();
Page page = new Page();//分页处理
List<String> keyWords = jieBaUtil.separateAndClear(words);//分词处理
List<Patent> result = new ArrayList<>();
if (keyWords.isEmpty()) {//防止搜索的词被分词系统删除为空
result = DataBaseSearcher.searchData(words);
}
else {
for (String keyword : keyWords) {
List<Patent> perResult = DataBaseSearcher.searchData(keyword);
result = jieBaUtil.listsToOne(result,perResult);//取交集加权
result.addAll(perResult);
}
}
if(result.isEmpty()) {
return Result.error(Constants.CODE_600,null);
}
Collections.sort(result);//排序
return Result.success(page.startPage(result,PageNum,PageSize));
}
}
取交集加权的方法:
public List<Patent> listsToOne(List<Patent> result,List<Patent> perResult) {
if (result.isEmpty()) {
}
else {
for (Patent patent1 : result) {
for (Iterator<Patent> it = perResult.iterator(); it.hasNext();) {
Patent patent2 = it.next();
if (patent1.getId().equals(patent2.getId())) {
patent1.setWeight(patent1.getWeight() + patent2.getWeight());
it.remove();
}
}
}
}
return result;
}
|