IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> elasticsearch中DSL之Term level query(term query) -> 正文阅读

[大数据]elasticsearch中DSL之Term level query(term query)

Term Level Query

这里翻译为字段查询,字段查询是查询的文本不会被分词,只有对应的文档精确存在对应的查询文本才会返回。

可以发现,字段查询是指查询文本不会被分词,而不是索引对应的mapping该字段不能分词,即使对应的字段是text属性,只要该文档的字段中存在对应的词元,就会返回。
一般如果没有指定查询文本的分词器,就会使用mapping定义该字段的分词器来分析查询文本,所以一般我们用字段查询都是查询mapping中字段属性为keyword的字段。但是这不意味着match不能搜索keyword定义的字段,也不能说字段查询不能搜索text定义的字段。只要文档中包含查询文本有效的词元都会返回。

索引的mapping
"myindex": {
 "aliases": {},
 "mappings": {
    "mytype": {
       "properties": {
          "addr": {
             "type": "text"
          },
          "age": {
             "type": "integer"
          },
          "city": {
             "type": "keyword"
          },
          "content": {
             "type": "text"
          },
          "name": {
             "type": "keyword"
          }
       }
    }
 }

查询1
GET myindex/_search
{
    "query": {
        "term": {
           "addr" : "zhongguo"
        }
    }
}
查询2
GET myindex/_search
{
    "query": {
        "match": {
           "name" : "mahuateng"
        }
    }
}
查询3
GET myindex/_search
{
    "query": {
        "match": {
           "addr" : "zhongguo"
        }
    }
}

都可以返回结果:
"hits": [
   {
      "_index": "myindex",
      "_type": "mytype",
      "_id": "2",
      "_score": 0.6931472,
      "_source": {
         "name": "mahuateng",
         "age": "40",
         "addr": "zhongguo guangdong shenzhen",
         "city": "shenzhen"
      }
   }
]

查询4
GET myindex/_search
{
    "query": {
        "term": {
           "addr" : "zhongguo guangdong guangzhou"
        }
    }
}
查询5
GET myindex/_search
{
    "query": {
        "match": {
           "name" : "zhangsan lisi"
        }
    }
}
返回结果:
{
  "_index": "myindex",
  "_type": "mytype",
  "_id": "5",
  "_score": 0.2876821,
  "_source": {
     "name": "zhangsan lisi",
     "age": "71",
     "addr": "zhongguo guangdong guangzhou",
     "city": "guangzhou"
  }
}

上例中addrtext属性,namekeyword属性;

  • 第一个查询是字段查询,搜索文本是zhongguo不会被分词(不会因为addr是text属性分词),所以要精确查询文档addr字段中是否存在zhongguo的文档。 因为文档中addr的值是zhongguo guangdong shenzhen,它会形成三个有效词zhongguoguangdongshenzhen,所以可以查到到结果。
  • 第二个查询是全文搜索,搜索文本是mahuateng,它会按照索引定义的name属性进行分词,因为namekeyword属性,所以不会被分词,要精确查询文档那么字段中是mahuateng的文档。
  • 第三个查询是全文搜索,搜索文本是zhongguo,它会按照索引定义的addr属性进行分词,因为addrtext属性,所以被分为zhongguo词元,因为文档中addr的值是zhongguo guangdong shenzhen,它会形成三个有效词zhongguoguangdongshenzhen,所以可以查到到结果。
  • 第四个查询返回为空,因为字段查询,搜索文本是zhongguo guangdong guangzhou不会被分词(不会因为addr是text属性分词),所以要精确查询文档addr字段中是否存在zhongguo guangdong guangzhou的文档。 因为文档中addr的值是zhongguo guangdong shenzhen,它会形成三个有效词zhongguoguangdongshenzhen,并没有zhongguo guangdong guangzhou这个词元,所以没有命中文档。
  • 第五个查询可以返回值,是全文搜索,搜索文本是zhangsan liszi,它会按照索引定义的name属性进行分词,因为namekeyword属性,所以不会被分词,要精确查询文档那么字段中是zhangsan lisi的文档。(而不是只要只要含有zhangsan,lisi其中一个词元就会返回,这个容易误解)

1、所以我们通常在使用的时候,字段查询通常作用于属性定义为keyword的字段。全文搜索通常作用于定义为text的字段。
2、 字段查询也可以作用于text的字段。只要文档中精确存在查询文本的对应的词元就会返回
3、全文搜索也可以作用于keyword字段,只是查询文本不会被分词,要精确配置才会返回。
4、字段查询决定查询文本不能分词,只要文档中精确存在对应的词元就会返回;全文搜索要分词,但是要按照规则分词(一般都是按照文档定义的mapping分词器分词),只要文档中存在分词后任何一个有效词元都会返回。

1.Term Query

单个字段查询:

GET myindex/_search
{
    "query": {
        "term": {
           "name" : "mahuateng"
        }
    }
}

精确查找name的反向索引中有mahuateng的文档。

2.Terms Query

多字段值精确查询

GET myindex/_search
{
   "query": {
       "terms": {
          "name": [
             "mahuateng",
             "renzhenfei"
          ]
       }
   }
}

返回结果:

"hits": [
 {
      "_index": "myindex",
      "_type": "mytype",
      "_id": "2",
      "_score": 0.9808292,
      "_source": {
         "name": "mahuateng",
         "age": "40",
         "addr": "zhongguo guangdong shenzhen",
         "city": "shenzhen"
      }
   },
   {
      "_index": "myindex",
      "_type": "mytype",
      "_id": "1",
      "_score": 0.2876821,
      "_source": {
         "name": "renzhenfei",
         "age": "71",
         "addr": "zhongguo guangdong guangzhou",
         "city": "guangzhou"
      }
   }
]
  • terms lookup mechanism:相当于sql中的级联查询(可以跨索引,也可以自己查自己)
    支持的参数:
    1.index :子查询的索引(与查询相同,可以省略)
    2.type:子查询的类型
    3.id:子查询的文档的id(其实内部是_id)
    4.path:查询的字段
    5.routing:可以自定义路由

从上可以发现,只能从id指定,这样的话,其实意义不大。

举个栗子:

定义一个索引
PUT my_other_index
{
    "mappings": {
        "mytype": {
            "properties": {
                "attr1" : {
                    "type": "keyword"
                },
                "attr2" : {
                    "properties": {
                        "attr2_in" :{
                            "type": "keyword"
                        }
                    }
                }
            }
        }
    }
}

写入数据:

POST my_other_index/mytype/1
{
    "attr1" :[ "1", "2"],
    "attr2" :{
        "attr2_in" : ["3", "4"]
    }
}
展示:
"hits": [
  {
     "_index": "my_other_index",
     "_type": "mytype",
     "_id": "1",
     "_score": 0.2876821,
     "_source": {
        "attr1": [
           "1",
           "2"
        ],
        "attr2": {
           "attr2_in": [
              "3",
              "4"
           ]
        }
     }
  }
]

现在我们使用级联查询(可以跨索

GET myindex/_search
{
   "query": {
       "terms": {
          "_id": {
              "index" : "my_other_index",
              "type" : "mytype",
              "id" : "1",
              "path" : "attr2.attr2_in"
          }
       }
   }
}

和
GET myindex/_search
{
   "query": {
       "terms": {
          "_id": {
              "index" : "my_other_index",
              "type" : "mytype",
              "id" : "1",
              "path" : "attr1"
          }
       }
   }
}
都可以返回myindex索引中的文档。

也可以自己查自己

GET myindex/_search
{
   "query": {
       "terms": {
          "age": {
              "index" : "myindex",
              "type" : "mytype",
              "id" : "1",
              "path" : "age"
          }
       }
   }
}

含义是查找与文档1相同年龄的人。

3.Range Query

范围查询

  • gte:大于等于
  • gt:大于
  • lte:小于等于
  • lt:小于
GET myindex/_search
{
   "query": {
       "range": {
          "age": {
              "gt" : 20
          }
       }
   }
}

4.Exists Query

字段存在非空值(空值是:null、[]、 [null] ),""不是空值。

GET myindex/_search
{
    "query": {
        "exists" :{
            "field" : "name"
        }
    }
}

字段是空值

GET myindex/_search
{
   "query": {
       "bool": {
           "must_not": [
              {
                  "exists" :{
                      "field" : "name"
                  }
              }
           ]
       }
   }
}

5.Prefix Query

前缀查询

GET myindex/_search
{
   "query": {
       "prefix": {
          "name": {
             "value": "ma"
          }
       }
   }
}

6.Wildcard Query

通配符查询

  • * :匹配任意0个或多个字符
  • ?:匹配任意1个字符
GET myindex/_search
{
   "query": {
       "wildcard": {
          "name": {
             "value": "ma*hua?*"
          }
       }
   }
}

1.不要使用*或者?开头查询,因为这样会导致特别慢。
2.本身通配符查询效率也不高。

7.Regexp Query

正则表达是查询

GET /_search
{
    "query": {
        "regexp":{
            "name.first": "s.*y"
        }
    }
}

和通配符?作用不同
通配符?是必须是一个字符
正则是前面的字符出现0次或1次
同样正则表达式可能效率很低

8.Fuzzy Query

模糊查询:和全文搜索参数是一致的。(编辑距离算法)

GET /_search
{
    "query": {
        "fuzzy" : {
            "user" : {
                    "value" :         "ki",
                    "boost" :         1.0,
                    "fuzziness" :     2,
                    "prefix_length" : 0,
                    "max_expansions": 100
            }
        }
    }
}

9.Ids Query

按照id查询

GET myindex/_search
{
    "query": {
        "ids": {
            "values": "1"
        }
    }
}

GET myindex/_search
{
    "query": {
        "ids": {
            "values": ["1", "2"]
        }
    }
}
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-11 12:28:56  更:2021-08-11 12:30:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/17 15:57:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码