IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Java知识库 -> elasticsearch + ik + springboot集成,插入数据和分词、高亮查询 -> 正文阅读

[Java知识库]elasticsearch + ik + springboot集成,插入数据和分词、高亮查询

本次使用的中间件版本:

elasticsearch:7.13.3
ik:7.13.2
springboot:2.1.3.RELEASE

1、中文分词器IK下载安装
下载地址

https://github.com/medcl/elasticsearch-analysis-ik/releases

在这里插入图片描述
2、下载后,解压到elasticsearch的插件目录中
在这里插入图片描述
3、修改IK的版本描述,因为这次用的IK的版本低于ES的版本
IK的版本号修改成当前ES的版本号
在这里插入图片描述
4、再次启动ES,通过ES的可视化工具,创建index
在这里插入图片描述
给刚才追加的索引,追加mapping
在这里插入图片描述
查看刚才设定的mapping,已经设定成功了
在这里插入图片描述
看看分词器的效果,使用其他工具也可以,这次使用postman
ik_smart的分词效果(汉语习惯)
在这里插入图片描述
ik_max_word的分词效果(穷举效果)
在这里插入图片描述
至此,ES + IK的简单设置,基本完成

5、springboot中集成ES
修改springboot的pom依赖

       <!-- springboot集成elasticsearch的依赖 -->
       <dependency>
           <groupId>org.elasticsearch.client</groupId>
           <artifactId>elasticsearch-rest-high-level-client</artifactId>
           <version>7.6.2</version>
       </dependency>

       <dependency>
           <groupId>org.springframework.boot</groupId>
           <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
       </dependency>

yml配置文件中进行追加

# Spring配置
spring:
  #elasticsearch 配置
  data:
    elasticsearch:
      # 默认elasticsearch
      cluster-name: elasticsearch
      # 9200是Http协议,主要用于外部通讯
      # 9300是Tcp协议,jar之间通过tcp协议通讯
      cluster-nodes: 127.0.0.1:9200

6、使用java程序进行插入数据

    @Autowired
    private RestHighLevelClient restHighLevelClient;
    IndexRequest indexRequest = new IndexRequest("tongyuan6_index", "_doc", "1");
    User user = new User();
    user.setName("李娜");
    user.setAge("25");
    user.setInfo("全国人民大团结万岁,中国的交通很发达,道路很漂亮,非常畅通?");
    indexRequest.source(JSONObject.toJSONString(user), XContentType.JSON);
    IndexResponse index = restHighLevelClient.index(indexRequest, RequestOptions.DEFAULT);
    System.out.println(JSONObject.toJSONString(index));

在这里插入图片描述

7、使用java程序进行分词、高亮检索

public List<JSONObject> searchContentListByES(PmcBimComment pmcBimComment) {
   List<JSONObject> blogList = new ArrayList<JSONObject>();
   try {
		   SearchRequest searchRequest = new SearchRequest("tongyuan6_index");
		   SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
		   //创建一个新的HighlightBuilder、高亮显示
		   HighlightBuilder highlightBuilder = new   HighlightBuilder().field("*").requireFieldMatch(false);
		   highlightBuilder.preTags("<span style=\"color:red\">");
		   highlightBuilder.postTags("</span>");
		   sourceBuilder.highlighter(highlightBuilder);
		   //创建一个新的MatchQueryBuilder、分词检索
		   MatchQueryBuilder matchQueryBuilder = QueryBuilders.matchQuery("info", "济南高新区");
		   sourceBuilder.query(matchQueryBuilder).timeout(new TimeValue(60, TimeUnit.SECONDS));
		   searchRequest.source(sourceBuilder);
		   //进行检索
		   SearchResponse response = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
		
		   // 对接过进行高亮显示编辑
		   for(SearchHit hit : response.getHits()){
		       Map<String, Object> source = hit.getSourceAsMap();
		       // 处理高亮片段
		       Map<String, HighlightField> highlightFields = hit.getHighlightFields();
		       HighlightField nameField = highlightFields.get("info");
		       if (nameField != null) {
		           Text[] fragments = nameField.fragments();
		           StringBuilder nameTmp = new StringBuilder();
		           for(Text text : fragments){
		               nameTmp.append(text);
		           }
		           //将高亮片段组装到结果中去
		           source.put("info", nameTmp.toString());
		       }
		   }
		   SearchHits hits = response.getHits();
		   SearchHit[] searchHits = hits.getHits();
		   // 组装返回结果
		   for (SearchHit hit : searchHits) {
		       JSONObject jsonObject = new JSONObject(hit.getSourceAsMap());
		       blogList.add(jsonObject);
		   }
   } catch (IOException e) {   }
   return blogList;
}

检索结果,明显看出"济南高新区"按照汉语语法被分解成"济南"、“高新区”,分别进行适配检索和高亮显示,同一个返回字段中,有多个"高新区",全部会高亮显示
在这里插入图片描述
8、好了,至此,全部完工

  Java知识库 最新文章
计算距离春节还有多长时间
系统开发系列 之WebService(spring框架+ma
springBoot+Cache(自定义有效时间配置)
SpringBoot整合mybatis实现增删改查、分页查
spring教程
SpringBoot+Vue实现美食交流网站的设计与实
虚拟机内存结构以及虚拟机中销毁和新建对象
SpringMVC---原理
小李同学: Java如何按多个字段分组
打印票据--java
上一篇文章      下一篇文章      查看所有文章
加:2021-07-17 12:33:52  更:2021-07-17 12:33:58 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/22 8:00:19-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码