| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> structure streaming 使用小结3-输出模式(appendupdatecomplete) -> 正文阅读 |
|
[大数据]structure streaming 使用小结3-输出模式(appendupdatecomplete) |
常规使用不提,主要是使用不同模式完成排序,数据更新操作,算是对小结2的补充优化。 1、排序,使用complete模式,将数据流看做静态表,不断追加数据,通过order by可以实现排序功能。
排序结果,好用 ? 官网说配合withWatermark实现数据过期处理,通过实验,结果失败,数据不能过期,随着数据量增大,表的数据会很大。如何配合使用,有待后续继续研究。(?.withWatermark("time","10 seconds")无效) ? 2、update模式配合max聚合,不支持排序order by。进行计数统计,使用?.withWatermark("time","10 seconds")无效。 ? ?去重可用,.dropDuplicates("timestamp") ? 去重加时间范围。去重可用,?withWatermark("time","10 seconds")无效。 ? 去重加sql语句的时间控制进行数据处理 .dropDuplicates("timestamp") " where timestamp >= unix_timestamp()-60 " + 3、append .withWatermark("time","10 seconds")延迟一个批次显示 使用聚合函数需要配合 .withWatermark("time","10 seconds")使用 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/22 23:36:04- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |