IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 把MySql中的数据导入elasticSearch中 -> 正文阅读

[大数据]把MySql中的数据导入elasticSearch中

首先elasticsearch是面向文档(Document)存储的,可以是数据库中的一条商品数据,一个订单信息。文档数据会被序列化为json格式后存储在elasticsearch中:

在这里插入图片描述
而Json文档中往往包含很多的字段(Field),类似于数据库中的列。

mysql与elasticsearch

我们统一的把mysql与elasticsearch的概念做一下对比:

MySQLElasticsearch说明
TableIndex索引(index),就是文档的集合,类似数据库的表(table)
RowDocument文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式
ColumnField字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)
SchemaMappingMapping(映射)是索引中文档的约束,例如字段类型约束。类似数据库的表结构(Schema)
SQLDSLDSL是elasticsearch提供的JSON风格的请求语句,用来操作elasticsearch,实现CRUD

下面的开始实现把MySql中的语句导入ElasticSearch中

1、分析在ElasticSearch中需要建立的索引所包含的字段

其中suggestion字段是一个集合,包括品牌名称、商品分类,这个字段是我们到时候要在搜索框中进行联想查询的字段,例如输入小字,就会进行联想到小米以及其他例如小红书、小说等等。
在这里插入图片描述
在这里插入图片描述

1.1、通过图形化界面kibana 去连接我们的elasticSearch进行建索引操作,也就是我们数据库中的表,这里就不介绍elasticSearch和kibana7.12.1是怎么安装的了。

在这里插入图片描述

1.2构建索引hmall

PUT /hmall
{
 "settings": {
    "analysis": {
      "analyzer": {
        "my_analyzer":{
          "tokenizer":"ik_max_word",
          "filter":"py"
        },
        "completion_analyzer":{
          "tokenizer":"keyword",
          "filter":"py"
        }
      },
      "filter": {
        "py":{
          "type":"pinyin",
          "keep_full_pingyin":false,
          "keep_joined_full_pinyin":true,
          "keep_original":true,
          "limit_first_letter_length":16,
          "remove_duplicated_term":true,
          "none_chinese_pinyin_tokenize":false
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "id": {
        "type": "keyword"
      },
      "name":{
        "type": "text",
        "analyzer": "ik_max_word",
        "copy_to": "all"
      },
      "price":{
        "type": "long"
      },
      "image":{
        "type": "keyword",
        "index": false
      }
      ,
      "category":{
        "type": "keyword",
         "copy_to": "all"
      },
       "brand":{
        "type": "keyword",
         "copy_to": "all"
      },
       "sold":{
        "type": "integer"
      },
       "commentCount":{
        "type": "integer"
      },
       "status":{
        "type": "integer"
      },
       "isAD":{
        "type": "boolean"
      }, 
      "all":{
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_max_word"
      },
      "suggestion":{
        "type": "completion",
        "analyzer": "completion_analyzer"
      }
    
    }
  }
}

2、初始化RestClient

在elasticsearch提供的API中,与elasticsearch一切交互都封装在一个名为RestHighLevelClient的类中,必须先完成这个对象的初始化,建立与elasticsearch的连接。

分为三步:

2.1、引入es的RestHighLevelClient依赖:

<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level-client</artifactId>
</dependency>

2.2、因为SpringBoot默认的ES版本是7.6.2,所以我们需要覆盖默认的ES版本:

<properties>
    <java.version>1.8</java.version>
    <elasticsearch.version>7.12.1</elasticsearch.version>
</properties>

2.3、初始化RestHighLevelClient:

初始化的代码如下:
在这里插入图片描述

@Configuration
public class EsConfig {

    @Bean
    public RestHighLevelClient restHighLevelClient(){
        return new RestHighLevelClient(RestClient.builder(HttpHost.create("http://192.168.153.144:9200")));
    }
}

3、elasticService服务要读取商品信息到elasticSearch中,那么就需要调用itemService服务把MySql中item表中的信息读取出来,这里我们服务与服务之间的调用是通过Feign来实现的,具体怎么实现,在我的另外一篇文章中有所介绍。

链接: Feign的使用.

在这里插入图片描述

3.1、定义一个对象RestHighLevelClient交给容器去管理,该对象是用来访问elaticSearch的。

在这里插入图片描述
我们可以使用RestHighLevelClient对象去操作elasticSearch的Api。

三、在测试类通过Api复制数据

在这里插入图片描述

源代码:

@SpringBootTest
public class EsTest {
    @Autowired
    private RestHighLevelClient client;
    @Autowired
    private ItemClient itemClient;

    final ObjectMapper objectMapper = new ObjectMapper();
    @Test
    public void testImport() throws IOException {
        int i = 1;
        while (true) {
            //调用feign 去itemservice中查询数据
            final PageDTO<Item> itemPageDTO = itemClient.queryByPage(i, 500);

            final List<Item> list = itemPageDTO.getList();

            if (list.size()<=0){
                break;
            }
            final BulkRequest bulkRequest = new BulkRequest();

            for (Item item : list) {
                final ItemDoc doc = new ItemDoc();
                BeanUtils.copyProperties(item, doc);
                doc.setSuggestion(Arrays.asList(doc.getBrand(), item.getCategory()));
                final IndexRequest hmall = new IndexRequest("hmall").id(doc.getId() + "");
                hmall.source(objectMapper.writeValueAsString(doc), XContentType.JSON);
                bulkRequest.add(hmall);
            }
            //利用restHight
            client.bulk(bulkRequest, RequestOptions.DEFAULT);
            i++;


        }


    }
}
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-07 22:46:53  更:2022-04-07 22:49:30 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 13:48:17-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码