一、Kibana安装
下载 Kibana 镜像
docker pull kibana:7.9.3
启动 Kibana 容器
docker run \
-d \
--name kibana \
--net es-net \
-p 5601:5601 \
-e ELASTICSEARCH_HOSTS='["http://node1:9200","http://node2:9200","http://node3:9200"]' \
--restart=always \
kibana:7.9.3
Kibana启动很慢,稍后浏览器访问 http://192.168.64.181:5601/ 进入 Dev Tools
二、索引、分片和副本
1 索引
Elasticsearch索引用来存储我们要搜索的数据,以倒排索引结构进行存储。 例如,要搜索商品数据,可以创建一个商品数据的索引,其中存储着所有商品的数据,供我们进行搜索 当索引中存储了大量数据时,大量的磁盘io操作会降低整体搜索新能,这时需要对数据进行分片存储。
2 索引分片
在一个索引中存储大量数据会造成性能下降,这时可以对数据进行分片存储。 每个节点上都创建一个索引分片,把数据分散存放到多个节点的索引分片上,减少每个分片的数据量来提高io性能: 每个分片都是一个独立的索引,数据分散存放在多个分片中,也就是说,每个分片中存储的都是不同的数据。搜索时会同时搜索多个分片,并将搜索结果进行汇总。
如果一个节点宕机分片不可用,则会造成部分数据无法搜索: 为了解决这一问题,可以对分片创建多个副本来解决。
3 索引副本
分片的工作机制:
- 主分片的数据会复制到副本分片
- 搜索时,以负载均衡的方式工作,提高处理能力
- 主分片宕机时,其中一个副本分片会自动提升为主分片
4 创建索引
分片和副本参数说明:
number_of_shards :分片数量,默认值是 5number_of_replicas :副本数量,默认值是 1 我们有三个节点,在每个节点上都创建一个分片。每个分片在另两个节点上各创建一个副本
创建索引,命名为 products 用索引名称过滤,查看 products 索引
5 映射(数据结构)
类似于数据库表结构,索引数据也被分为多个数据字段,并且需要设置数据类型和其他属性。 映射,是对索引中字段结构的定义和描述。
字段的数据类型
数字类型: byte、short、integer、long float、double unsigned_long 字符串类型: text : 会进行分词 keyword : 不会进行分词,适用于email、主机地址、邮编等 日期和时间类型: date 类型参考: https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-types.html
创建映射
在 products 索引中创建映射。 分词器设置: analyzer :在索引中添加文档时,text类型通过指定的分词器分词后,再插入倒排索引 search_analyzer :使用关键词检索时,使用指定的分词器对关键词进行分词 查询时,关键词优先使用 search_analyzer 设置的分词器,如果 search_analyzer 不存在则使用 analyzer 分词器。
PUT /products/_mapping
{
"properties": {
"id": {
"type": "long"
},
"title": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"category": {
"type": "text",
"analyzer": "ik_smart",
"search_analyzer": "ik_smart"
},
"price": {
"type": "float"
},
"city": {
"type": "text",
"analyzer": "ik_smart",
"search_analyzer": "ik_smart"
},
"barcode": {
"type": "keyword"
}
}
}
映射参考: https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping.html
查看映射 GET /products/_mapping
6 文档操作
添加文档
添加的文档会有一个名为_id的文档id,这个文档id可以自动生成,也可以手动指定,通常可以使用数据的id作为文档id。
PUT /products/_doc/10033
{
"id":"10033",
"title":"SONOS PLAY:5(gen2) 新一代PLAY:5无线智能音响系统 WiFi音箱家庭,潮酷数码会场",
"category":"潮酷数码会场",
"price":"3980.01",
"city":"上海",
"barcode":"527848718459"
}
PUT /products/_doc/10034
{
"id":"10034",
"title":"天猫魔盒 M13网络电视机顶盒 高清电视盒子wifi 64位硬盘播放器",
"category":"潮酷数码会场",
"price":"398.00",
"city":"浙江杭州",
"barcode":"522994634119"
}
也可以自动生成 _id 值:
POST /products/_doc
{
"id":"10027",
"title":"vivo X9前置双摄全网通4G美颜自拍超薄智能手机大屏vivox9",
"category":"手机会场",
"price":"2798.00",
"city":"广东东莞",
"barcode":"541396973568"
}
查看文档: GET /products/_doc/10037 查看指定文档title字段的分词结果: GET /products/_doc/10037/_termvectors?fields=title
修改文档
底层索引数据无法修改,修改数据实际上是先删除再重新添加 。 两种修改方式: PUT:对文档进行完整的替换 ,原来文档直接删除,新文档只有新添加的数据 POST:可以修改一部分字段
修改价格字段的值:
PUT /products/_doc/10037
{
"price":"9999.99"
}
修改价格和城市字段的值:
POST /products/_update/10037
{
"doc": {
"price":"8888.88",
"city":"深圳"
}
}
删除文档 DELETE /products/_doc/10037
清空文档
POST /products/_delete_by_query
{
"query": {
"match_all": {}
}
}
删除索引 DELETE /products # 删除 products 索引
三、搜索
1 创建索引和映射
PUT /pditems
{
"settings": {
"number_of_shards": 3,
"number_of_replicas": 2
},
"mappings": {
"properties": {
"id": {
"type": "long"
},
"brand": {
"type": "text",
"analyzer": "ik_smart"
},
"title": {
"type": "text",
"analyzer": "ik_max_word"
},
"sell_point": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"price": {
"type": "float"
},
"image": {
"type": "keyword"
},
"cid": {
"type": "long"
},
"status": {
"type": "byte"
},
"created": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss"
},
"updated": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss"
}
}
}
}
用 head 查看索引:
2 导入数据
下载文件,下载地址 链接:https://pan.baidu.com/s/1wOon8-RYZvA-UxEE2jrffw 提取码:289p 上传到/root目录,解压,进入pditems目录,可看见pditems.json 文件,执行批量数据导入:
curl -XPOST 'localhost:9200/pditems/_bulk' \
-H 'Content-Type:application/json' \
--data-binary @pditems.json
head查看数据
3 查看数据
搜索 pditems 索引中全部 3160 条数据,不写size属性,默认值查询10条数据。查询结果hit数据是总共有多少条数据
GET /pditems/_search
{
"query": {
"match_all": {}
},
"size": 3160
}
4 关键词搜索
POST /pditems/_search
{
"query": {
"match": {
"title": "电脑"
}
}
}
5 搜索结果过滤器
POST /pditems/_search
{
"query": {
"bool": {
"must": [
{
"match": {
"title": "电脑"
}
}
],
"filter": [
{
"range": {
"price": {
"gte": "2000"
}
}
}
]
}
}
}
6 搜索结果高亮显示
POST /pditems/_search
{
"query": {
"multi_match":{
"query": "手机",
"fields": ["title", "sell_point"]
}
},
"highlight" : {
"pre_tags" : ["<i class=\"highlight\">"],
"post_tags" : ["</i>"],
"fields" : {
"title" : {},
"sell_point" : {
"pre_tags": "<em>",
"post_tags": "</em>"
}
}
}
}
|