IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 初识 Elasticsearch -> 正文阅读

[大数据]初识 Elasticsearch

Kibana 和 Elasticsearch 使用

1. 文档地址

  • Elasticsearch 下载地址:https://www.elastic.co/cn/downloads/elasticsearch
  • Elasticsearch 英文文档 :https://www.elastic.co/guide/en/elasticsearch/reference/master/index.html
  • Elasticsearch 中文文档:https://www.elastic.co/guide/cn/elasticsearch/guide/current/running-elasticsearch.html
  • Kibana 下载文档: https://www.elastic.co/cn/downloads/kibana
  • Kibana 用户指南 : https://www.elastic.co/guide/cn/kibana/current/introduction.html

2. Elasticsearch 的安装

  • Elasticsearch 是一个分布式文件存储系统,存储数据的方式和 MongoDB一样,是面向文档存储;

  • 从指定网站下载 WINDOWS 版本压缩包到本地;

  • 解压打开 /bin 文件夹 运行 elasticsearch.bat 启动成功

  • 注意 Elasticsearch 是基于java开发的,所以本地要有 java环境;

  • 验证启动是否成功: cmd 环境下 访问 curl http://localhost:9200/?prett

  • 如果启动成功,应该会得到以下响应

    {
      "name" : "DESKTOP-N23GA7R",
      "cluster_name" : "elasticsearch",
      "cluster_uuid" : "8PYuCc5ATvymKw5brgP2qA",
      "version" : {
        "number" : "7.14.0",
        "build_flavor" : "default",
        "build_type" : "zip",
        "build_hash" : "dd5a0a2acaa2045ff9624f3729fc8a6f40835aa1",
        "build_date" : "2021-07-29T20:49:32.864135063Z",
        "build_snapshot" : false,
        "lucene_version" : "8.9.0",
        "minimum_wire_compatibility_version" : "6.8.0",
        "minimum_index_compatibility_version" : "6.0.0-beta1"
      },
      "tagline" : "You Know, for Search"
    }
    

3. Kibana 的安装

  • Kibana 是操作 Elasticsearch 数据的可视化 Web 端

  • Kibana 是一个开源分析和可视化平台,旨在与 Elasticsearch 配合使用。您可以使用 Kibana 搜索、查看存储在 Elasticsearch 索引中的数据并与之交互。您可以轻松地执行高级数据分析并在各种图表、表格和地图中可视化您的数据。

  • 从指定网站下载 WINDOWS 版本压缩包到本地;

  • 解压打开 /bin 文件夹 运行 kibana.bat 启动成功

  • 访问 http://localhost:5601/ 显示 Kibana Web端

  • 打开 Dev Tools - Elastic 访问 Elasticsearch 操作控制端,进行Elasticsearch 数据操作;

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RJ6YHKHg-1628674785691)(C:\Users\C\Desktop\1628238374194.png)]

4. Elasticsearch 命令使用

  • 索引(名词):

    如前所述,一个 索引 类似于传统关系数据库中的一个 数据库 ,是一个存储关系型文档的地方。 索引 (index) 的复数词为 indicesindexes

    索引(动词):

    索引一个文档 就是存储一个文档到一个 索引 (名词)中以便被检索和查询。这非常类似于 SQL 语句中的 INSERT 关键词,除了文档已存在时,新文档会替换旧文档情况之外。

  • 使用 Kibana Dev Tools 操作命令;

  • 在 Dev Tools 中使用的命令为简化命令,例如

    // 计算集群中完整的文档数量,完整写法如下:
    curl -XGET 'localhost:9200/_count?pretty' -d '
    {
        "query": {
            "match_all": {}
        }
    }'
    
    
    // Dev Tools  中使用缩写格式来展示这些 curl 示例,所谓的缩写格式就是省略请求中所有相同的部分,例如主机名、端口号以及 curl 命令本身
    
    // 缩略格式
    GET /_count
    {
        "query": {
            "match_all": {}
        }
    }
    
    
  • 常用命令如下

  • PUT : 新增数据/修改数据

  • GET: 可以用来检索文档

  • DELETE: 删除文档

  • HEAD : 检查文档是否存在

// 计算集群中完整的文档数量
GET /_count?pretty
{

    "query": {

        "match_all": {}

    }

}

// 添加数据/数据已经存在就会更新文档
//  megacorp: 索引名称,这里的索引相当于数据库名
// employee :   类型名称
// 1        : 数据id
// 中括号包围的数据为 员工数据 ,为一个json
PUT /megacorp/employee/1
{
    "first_name" : "John",
    "last_name" :  "Smith",
    "age" :        25,
    "about" :      "I love to go rock climbing",
    "interests": [ "sports", "music" ]
}
PUT /megacorp/employee/2
{
    "first_name" :  "Jane",
    "last_name" :   "Smith",
    "age" :         32,
    "about" :       "I like to collect rock albums",
    "interests":  [ "music" ]
}
PUT /megacorp/employee/3
{
    "first_name" :  "Douglas",
    "last_name" :   "Fir",
    "age" :         35,
    "about":        "I like to build cabinets",
    "interests":  [ "forestry" ]
}


// 定向检索
GET /megacorp/employee/1

// 检索 megacorp索引下 employee 类型的所有数据,默认返回十条结果
GET /megacorp/employee/_search?pretty

//  查询字符串 (query-string) 搜索
GET /megacorp/employee/_search?q=last_name:Smith


// 使用请求体构建查询参数,查询 last_name = Smith 的员工数据
// match 查询为查询类型之一
GET /megacorp/employee/_search
{
    "query" : {
        "match" : {
            "last_name" : "Smith"
        }
    }
}


// 搜索姓氏为 Smith 的员工,同时需要年龄大于 30 
// range 过滤器 , 它能找到年龄大于 30 的文档,其中 gt 表示_大于_(great than)
GET /megacorp/employee/_search
{
    "query" : {
        "bool": {
            "must": {
                "match" : {
                    "last_name" : "smith" 
                }
            },
            "filter": {
                "range" : {
                    "age" : { "gt" : 30 } 
                }
            }
        }
    }
}


//  全文搜索
// 搜索下所有喜欢攀岩(rock climbing)的员工
// 搜索 about属性为 rock climbing 的员工
// 
GET /megacorp/employee/_search
{
    "query" : {
        "match" : {
            "about" : "rock climbing"
        }
    }
}


//  返回结果
// 根据每个文档跟查询条件的匹配程度,进行相关性得分排序(排序规则从高到低);
// Jane Smith 的 about属性中有“rock”,就有了相似性,但是得分会低于 John Smith
// 与传统数据库不同的是,传统数据库是直接匹配,而 ES 是相似性匹配,然后排序。PS:只要
文档中含有查询条件中的任何一个元素就能进行相似性匹配。
{
   ...
   "hits": {
      "total":      2,
      "max_score":  0.16273327,
      "hits": [
         {
            ...
            "_score":         0.16273327, 
            "_source": {
               "first_name":  "John",
               "last_name":   "Smith",
               "age":         25,
               "about":       "I love to go rock climbing",
               "interests": [ "sports", "music" ]
            }
         },
         {
            ...
            "_score":         0.016878016, 
            "_source": {
               "first_name":  "Jane",
               "last_name":   "Smith",
               "age":         32,
               "about":       "I like to collect rock albums",
               "interests": [ "music" ]
            }
         }
      ]
   }
}


// match_phrase 查询 精确匹配一系列单词或者_短语_ 
// 仅匹配同时包含 “rock” 和 “climbing” ,并且 二者以短语 “rock climbing” 的形式紧挨着的雇员记录。
// 类似于 mysql 中的 like 查询
GET /megacorp/employee/_search
{
    "query" : {
        "match_phrase" : {
            "about" : "rock climbing"
        }
    }
}


// 高亮搜索
// 添加 hlight 参数
// 高亮显示符合查询条件的部分片段,类似于百度查询结果的高亮显示
GET /megacorp/employee/_search
{
    "query" : {
        "match_phrase" : {
            "about" : "rock climbing"
        }
    },
    "highlight": {
        "fields" : {
            "about" : {}
        }
    }
}

// 查询结果
// highlight 部分是高亮显示的字段属性,文档和查询条件进行匹配成功的片段用 <em>标签 进行修饰,表示高亮
{
   ...
   "hits": {
      "total":      1,
      "max_score":  0.23013961,
      "hits": [
         {
            ...
            "_score":         0.23013961,
            "_source": {
               "first_name":  "John",
               "last_name":   "Smith",
               "age":         25,
               "about":       "I love to go rock climbing",
               "interests": [ "sports", "music" ]
            },
            "highlight": {
               "about": [
                  "I love to go <em>rock</em> <em>climbing</em>" 
               ]
            }
         }
      ]
   }
}


// 聚合分析  功能类似于 SQL 中的 GROUP BY ,但是更完善
// 对于聚合的字段没有添加索引,执行聚合语句就会报错,如下
{
  "error" : {
    "root_cause" : [
      {
        "type" : "illegal_argument_exception",
        "reason" : "Text fields are not optimised for operations that require per-document field data like aggregations and sorting, so these operations are disabled by default. Please use a keyword field instead. Alternatively, set fielddata=true on [interests] in order to load field data by uninverting the inverted index. Note that this can use significant memory."
      }
    ]
    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  中间省略
  "status" : 400
}

// 添加字段索引
PUT /megacorp/_mapping
{
"properties": {
    "interests": {  // 字段名称 
      "type":     "text",
      "fielddata": true
    }
  }
}

// 查询所有索引
GET _cat/indices?v

// 聚合员工中最受欢迎的兴趣爱好
// aggregations.all_interests 中表示聚合结果
GET /megacorp/employee/_search
{
  "aggs": {
    "all_interests": {
      "terms": { "field": "interests" }
    }
  }
}


// 结合查询的聚合
//  叫 Smith 的员工中最受欢迎的兴趣爱好
GET /megacorp/employee/_search
{
  "query": {
    "match": {
      "last_name": "smith"
    }
  },
  "aggs": {
    "all_interests": {
      "terms": {
        "field": "interests"
      }
    }
  }
}

// 对以上的结果进行聚合汇总,查询每个兴趣爱好员工的平均年龄
GET /megacorp/employee/_search
{
    "aggs" : {
        "all_interests" : {
            "terms" : { "field" : "interests" },
            "aggs" : {
                "avg_age" : {
                    "avg" : { "field" : "age" }
                }
            }
        }
    }
}


  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-12 16:40:01  更:2021-08-12 16:41:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 9:33:32-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码