[大数据] elasticsearch 聚合操作分组查询并列分组在通过其他字段求sum 排序并列分组效果类似于 Mysql中的（Select AB from 表名 group by AB)

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> elasticsearch 聚合操作分组查询并列分组在通过其他字段求sum 排序并列分组效果类似于 Mysql中的（Select AB from 表名 group by AB) -> 正文阅读

[大数据]elasticsearch 聚合操作分组查询并列分组在通过其他字段求sum 排序并列分组效果类似于 Mysql中的（Select AB from 表名 group by AB)

需求

有三个字段需要把A字段和B字段结合起来共同分组

用Mysql 写的话就相当一是
Select A,B from 表名 group by A,B

但是在elasticsearch 的查询中分组都是 :

Aggregation（中文意思：聚合）关键字进行聚合分组，然后是最关键的，多个group by不能使用并列Aggregation，必须使用嵌套聚合，采用subAggregation进行嵌套！！

TermsAggregationBuilder agg_top_elapsed_time_by_application =
 AggregationBuilders.terms("xxxxxxxxx").field("你在ES 的字段名字")
.subAggregation(AggregationBuilders.sum("xxxxxx").field("你在ES 的字段名字"));

在Java Api 里面只能这样嵌套查询不能说把这两个分组并列
在kibana 的语法中是可以使用脚本去把我们想要的group by 给结果如下

GET /{索引名}/_search
{
    "size": 0,
    "query": {
        "match_all": {}
    },
    "aggs": {
        "sexprof": {
            "terms": {
                "script": {
                   "inline": "doc['destination_port'].value +'-split-'+ doc['protocol_id'].value"
                }
            }
        }
    }
}

结果
在这里插入图片描述
接下来就是调用Java Api 来查询了网上说要更改YML 配置的都是假的最后是查看官方给的Api 才发现官方早就停止使用groovy 所以用的painless
代码如下

 //	 // 把A,B放到一个分组 这里如果是7版本的ES 需要在字段的后面加上类型
        Script script = new Script(ScriptType.INLINE,"painless", "doc['A'].value+'-'+doc['B'].value",new HashMap<String, Object>());
        AggregationBuilder aggregationBuilderCount = AggregationBuilders.terms("定义名字").script(script).order(BucketOrder.count(false)).size(3).subAggregation(protocolIDTerm);

结果如下
在这里插入图片描述
整体代码

 		String indexName = "xxxxxx";
        SearchRequest searchRequest = new SearchRequest(indexName);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.size(0);
		 // 把A,B放到一个分组 这里如果是7版本的ES 需要在字段的后面加上类型
        Script script = new Script(ScriptType.INLINE,"painless", "doc['A'].value+'-'+doc['B'].value",new HashMap<String, Object>());
 AggregationBuilder aggregationBuilderCount = AggregationBuilders.terms("你定义名字").script(script).order(BucketOrder.count(false)).size(3).subAggregation(protocolIDTerm);

        searchSourceBuilder.aggregation(aggregationBuilderCount);
        searchRequest.source(searchSourceBuilder);
        //
        SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);
        Aggregations aggregations = response.getAggregations();
        Terms aggregation = aggregations.get("你定义名字");
        List<? extends Terms.Bucket> list = aggregation.getBuckets();
        list.stream().forEach(prot -> {
           System.out.println("======= 端口 " + prot.getKey() + ":" + prot.getDocCount() + "==============");
        });