IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 24.Elasticsearch索引聚合查询—Bucket聚合-2 -> 正文阅读

[大数据]24.Elasticsearch索引聚合查询—Bucket聚合-2

24.1 前置条件的过滤:filter

24.1.1 对filter进行分组聚合:filters

  • 示例:日志系统中,每条日志都是在文本中,包含warning/info等信息
PUT /test-agg-logs/_bulk?refresh
{ "index" : { "_id" : 1 } }
{ "body" : "warning: page could not be rendered" }
{ "index" : { "_id" : 2 } }
{ "body" : "authentication error" }
{ "index" : { "_id" : 3 } }
{ "body" : "warning: connection timed out" }
{ "index" : { "_id" : 4 } }
{ "body" : "info: hello pdai" }
  • 需要对包含不同日志类型的日志进行分组,这就需要filters:
GET /test-agg-logs/_search
{
  "size": 0,
  "aggs" : {
    "messages" : {
      "filters" : {
        "other_bucket_key": "other_messages",
        "filters" : {
          "infos" : { "match" : { "body" : "info" }},
          "warnings" : { "match" : { "body" : "warning" }}
        }
      }
    }
  }
}

24.2 对number类型聚合:Range

  • 基于多桶值源的聚合,使用户能够定义一组范围-每个范围代表一个桶
    • 在聚合过程中,将从每个存储区范围中检查从每个文档中提取的值,并“存储”相关/匹配的文档
GET /test-agg-cars/_search
{
  "size": 0,
  "aggs": {
    "price_ranges": {
      "range": {
        "field": "price",
        "ranges": [
          { "to": 20000 },
          { "from": 20000, "to": 40000 },
          { "from": 40000 }
        ]
      }
    }
  }
}

24.3 对IP类型聚合:IP Range

  • 专用于IP值的范围聚合
  • 返回:

24.4 对日期类型聚合:Date Range

  • 专用于日期值的范围聚合

24.5 对柱状图功能:Histrogram

  • 创建直方图需要指定一个区间,如果要为售价创建一个直方图,可以将间隔设为20,000
    • 这样做将会在每个 $20,000 档创建一个新桶,然后文档会被分到对应的桶中
  • 对于仪表盘来说,希望知道每个售价区间内汽车的销量
    • 还会想知道每个售价区间内汽车所带来的收入,可以通过对每个区间内已售汽车的售价求和得到
  • 可以用 histogram 和一个嵌套的 sum 度量得到想要的答案:
GET /test-agg-cars/_search
{
  "size" : 0,
  "aggs":{
    "price":{
      "histogram":{ 
        "field": "price.keyword",
        "interval": 20000
      },
      "aggs":{
        "revenue": {
          "sum": { 
            "field" : "price"
          }
        } 
      } 
    } 
  } 
}


大数据视频推荐:
腾讯课堂
大数据语音推荐:
ELK7 stack开发运维
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-28 11:56:15  更:2022-04-28 11:58:13 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 1:14:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码