IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Flink入门第十五课:在Table api&Flink sql中使用Flink的自定义函数 -> 正文阅读

[大数据]Flink入门第十五课:在Table api&Flink sql中使用Flink的自定义函数

package com.atguigu.HUDF;

import com.atguigu.Zbeans.SensorReading;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.EnvironmentSettings;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.java.StreamTableEnvironment;
import org.apache.flink.table.functions.AggregateFunction;
import org.apache.flink.table.functions.ScalarFunction;
import org.apache.flink.table.functions.TableFunction;
import org.apache.flink.types.Row;

/**
 * 本来展示了自定义标量函数、表函数、聚合函数的使用。
 */
public class AMyUDFTest {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);
        EnvironmentSettings settings = EnvironmentSettings.newInstance()
                .useBlinkPlanner()
                .inStreamingMode()
                .build();
        StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env, settings);

        DataStreamSource<String> inputStream = env.readTextFile("G:\\SoftwareInstall\\idea\\project\\UserBehaviorAnalysis\\BasicKnowledge\\src\\main\\resources\\sensor.txt");
        SingleOutputStreamOperator<SensorReading> mapStream = inputStream.map(line -> {
            String[] fields = line.split(",");
            return new SensorReading(new String(fields[0]), new Long(fields[1]), new Double(fields[2]));
        });

        Table inputTable = tableEnv.fromDataStream(mapStream, "id,timestamp as ts,temperature as temp");//流转表
        tableEnv.createTemporaryView("sensor",inputTable);//注册视图,便于书写sql
        tableEnv.registerFunction("hashCode",new UDF_Scalar(13));//注册标量函数
        tableEnv.registerFunction("split",new UDF_table("_"));//注册表函数
        tableEnv.registerFunction("avgTemp",new UDF_aggregate());//注册聚合函数

        //Table api
        Table result1 = inputTable.select("id,ts,hashCode(id)");//测标量函数
        Table result2 = inputTable.joinLateral("split(id) as (word,length)")//侧写连接,将拆分结果放到原表末尾
                .select("id,ts,word,length");//测表函数
        Table result3 = inputTable.groupBy("id")
                .aggregate("avgTemp(temp) as avg_temp")//使用注册的聚合函数
                .select("id,avg_temp");//测试聚合函数


        //Flink sql
        Table result11 = tableEnv.sqlQuery("select id,ts,hashCode(id) from sensor");//测标量函数
        Table result22 = tableEnv.sqlQuery("select id,ts,word,length from " +
                " sensor,lateral table(split(id)) as t_split(word,length)");//测表函数
        Table result33 = tableEnv.sqlQuery("select id,avgTemp(temp) avg_temp from sensor group by id");//测聚合函数


        //打印输出
        tableEnv.toAppendStream(result1, Row.class).print("scalar function in table api");
        tableEnv.toAppendStream(result11, Row.class).print("scalar function in flink sql");
        tableEnv.toAppendStream(result2, Row.class).print("table function in table api");
        tableEnv.toAppendStream(result22, Row.class).print("table function in flink sql");
        tableEnv.toRetractStream(result3, Row.class).print("aggregate function in table api");//非窗口内聚合,用toRetractStream
        tableEnv.toRetractStream(result33, Row.class).print("aggregate function in flink sql");//非窗口内聚合,用toRetractStream
        //执行
        env.execute("table api & flink sql 自定义函数测试");
    }

    //自定义标量函数,一对一。继承ScalarFunction,定义eval方法。
    // eval返回值和参数没要求,但必须public修饰。
    public static class UDF_Scalar extends ScalarFunction{
        private Integer factor;

        public UDF_Scalar(Integer factor) {
            this.factor = factor;
        }
        //函数名必须eval,访问范围必须public,返回值和参数类型没要求
        public int eval(String str){
            return str.hashCode()*factor;
        }
    }

    //自定义表函数,一对N。继承TableFuction(泛型为输出类型),定义eval方法。
    // eval参数没要求,但必须public修饰。返回值为空,通过collect输出。
    public static class UDF_table extends TableFunction<Tuple2<String,Integer>>{
        private String separator=",";

        public UDF_table(String separator) {
            this.separator = separator;
        }
        
        public void eval(String str){
            for (String s:str.split(separator)) {
                collect(new Tuple2<>(s,s.length()));
            }
        }
    }
    //自定义聚合函数,N对1。继承AggregateFuction(泛型输出类型和累加器类型),定义createAccumulator、getValue、accumulate方法。
    //accumulate方法必须public void修饰,且形参1必须是累加器,形参2必须是输入数据。
    public static class UDF_aggregate extends AggregateFunction<Double, Tuple2<Double,Integer>>{

        @Override
        public Double getValue(Tuple2<Double, Integer> acc) {//定义累加器累加规则
            return acc.f0/acc.f1;
        }

        @Override
        public Tuple2<Double, Integer> createAccumulator() {//定义累加器并赋初值
            return new Tuple2<Double,Integer>(0.0,0);
        }

        public void accumulate(Tuple2<Double, Integer> acc,Double temp){//获取外部数据,更新累加器
            acc.f0 += temp;
            acc.f1 += 1;
        }
    }
}

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-31 15:30:56  更:2021-08-31 15:32:47 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 16:45:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码