Flink_标签_开发者_华为云

博客(352)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Flink从入门到精通100篇（二十一）-Flink 状态(State)管理在推荐场景中的应用
前言 Flink作为纯流式大数据实时计算引擎，较于Spark Streaming的微批处理引擎，不管是内存管理，多流合并，还是时间窗口，迭代处理上，Flink在实时计算场景更较适合。而Flink的State状态管理，更是让Flink在实时计算领域，更胜一筹。通过对Flink State状态的灵活妙用，可以完美实现大数据下的实时数仓，实...

格图洛书
发表于2021-11-18 23:49:26
2540 0 0

2.5k 0 0

前言 Flink作为纯流式大数据实时计算引擎，较于Spark Streaming的微批处理引擎，不管是内存管理，多流合并，还是时间窗口，迭代处理上，Flink在实时计算场景更较适合。而Flink的State状态管理，更是让Flink在实时计算领域，更胜一筹。通过对Flink State状态的灵活妙用，可以完美实现大数据下的实时数仓，实...
Flink
Flink从入门到精通100篇（二十）-Zeppelin SDK在Flink 中的应用（附测试代码）
前言用过 Zeppelin 的人应该比较熟悉 Zeppelin 的 UI，因为 Zeppelin 的主要使用场景都是交互式，用户需要手动来操作。那除了这种手动的方式，还有其他的方式吗？如果你不想用 Zeppelin UI，但又想用 Zeppelin 提交和管理大数据作业（比如 Flink Job）的能力该怎么办？或者是你...

格图洛书
发表于2021-11-18 23:22:46
4628 0 0

4.6k 0 0

前言用过 Zeppelin 的人应该比较熟悉 Zeppelin 的 UI，因为 Zeppelin 的主要使用场景都是交互式，用户需要手动来操作。那除了这种手动的方式，还有其他的方式吗？如果你不想用 Zeppelin UI，但又想用 Zeppelin 提交和管理大数据作业（比如 Flink Job）的能力该怎么办？或者是你...
API/SDK Flink
Flink从入门到精通100篇（十）-双亲委派模型与 Flink 的类加载策略
前言我们知道，在 JVM 中，一个类加载的过程大致分为加载、链接（验证、准备、解析）、初始化5个阶段。而我们通常提到类的加载，就是指利用类加载器（ClassLoader）通过类的全限定名来获取定义此类的二进制字节码流，进而构造出类的定义。   Flink 作为基于 JVM 的框架，在 flink-conf.yaml 中...

格图洛书
发表于2021-11-18 23:20:11
2798 0 0

2.7k 0 0

前言我们知道，在 JVM 中，一个类加载的过程大致分为加载、链接（验证、准备、解析）、初始化5个阶段。而我们通常提到类的加载，就是指利用类加载器（ClassLoader）通过类的全限定名来获取定义此类的二进制字节码流，进而构造出类的定义。   Flink 作为基于 JVM 的框架，在 flink-conf.yaml 中...
Flink
2021年大数据Flink（三）：Flink安装部署 Local本地模式
目录 Flink安装部署 Local本地模式原理操作测试 Flink安装部署 Flink支持多种安装模式 - Local—本地单机模式，学习测试时使用- Standalone—独立集群模式，Flink自带集群，开发测试环境使用- StandaloneHA—独立集群高可用模式，Flink自带集群，开发测试环境使用-...

Lansonli
发表于2021-09-29 01:20:46
3177 0 0

3.1k 0 0

目录 Flink安装部署 Local本地模式原理操作测试 Flink安装部署 Flink支持多种安装模式 - Local—本地单机模式，学习测试时使用- Standalone—独立集群模式，Flink自带集群，开发测试环境使用- StandaloneHA—独立集群高可用模式，Flink自带集群，开发测试环境使用-...
Flink 大数据
2021年大数据Flink（五）：Standalone-HA高可用集群模式
目录 Standalone-HA高可用集群模式原理操作 1.集群规划 2.启动ZooKeeper 3.启动HDFS 4.停止Flink集群 5.修改flink-conf.yaml 6.修改masters 7.同步 8.修改node2上的flink-conf.yaml 9.重新启动Flink集群,node1上执...

Lansonli
发表于2021-09-29 01:14:38
4103 0 0

4.1k 0 0

目录 Standalone-HA高可用集群模式原理操作 1.集群规划 2.启动ZooKeeper 3.启动HDFS 4.停止Flink集群 5.修改flink-conf.yaml 6.修改masters 7.同步 8.修改node2上的flink-conf.yaml 9.重新启动Flink集群,node1上执...
Flink 大数据
2021年大数据Flink（十一）：流批一体API Source
目录 Source 预定义Source 基于集合的Source 基于文件的Source 基于Socket的Source 自定义Source 随机生成数据 MySQL Source     预定义Source 基于集合的Source API 一般用于学习测试...

Lansonli
发表于2021-09-29 01:14:13
3535 0 0

3.5k 0 0

目录 Source 预定义Source 基于集合的Source 基于文件的Source 基于Socket的Source 自定义Source 随机生成数据 MySQL Source     预定义Source 基于集合的Source API 一般用于学习测试...
API Flink 大数据
2021年大数据Flink（二十一）：案例三会话窗口
目录案例三会话窗口需求代码实现案例三会话窗口需求设置会话超时时间为10s,10s内没有数据到来,则触发上个窗口的计算   代码实现 package cn.itcast.window; import lombok.AllArgsConstructor;import lombok...

Lansonli
发表于2021-09-29 01:06:24
2849 0 0

2.8k 0 0

目录案例三会话窗口需求代码实现案例三会话窗口需求设置会话超时时间为10s,10s内没有数据到来,则触发上个窗口的计算   代码实现 package cn.itcast.window; import lombok.AllArgsConstructor;import lombok...
Flink 大数据
2021年大数据Flink（三十六）：Table与SQL 案例三
目录案例三需求编码步骤代码实现-方式1 代码实现-方式2 案例三需求使用Flink SQL来统计5秒内每个用户的订单总数、订单的最大金额、订单的最小金额也就是每隔5秒统计最近5秒的每个用户的订单总数、订单的最大金额、订单的最小金额上面的需求...

Lansonli
发表于2021-09-29 00:53:15
3385 0 0

3.3k 0 0

目录案例三需求编码步骤代码实现-方式1 代码实现-方式2 案例三需求使用Flink SQL来统计5秒内每个用户的订单总数、订单的最大金额、订单的最小金额也就是每隔5秒统计最近5秒的每个用户的订单总数、订单的最大金额、订单的最小金额上面的需求...
Flink SQL 大数据
2021年大数据Flink（四十二）：BroadcastState
目录 BroadcastState BroadcastState介绍需求-实现配置动态更新编码步骤 1.env 2.source 3.transformation 4.sink 5.execute 参考实现实现代码   BroadcastState BroadcastState介...

Lansonli
发表于2021-09-29 00:51:24
2994 0 0

2.9k 0 0

目录 BroadcastState BroadcastState介绍需求-实现配置动态更新编码步骤 1.env 2.source 3.transformation 4.sink 5.execute 参考实现实现代码   BroadcastState BroadcastState介...
Flink 大数据
2021年大数据Flink（三十七）：Table与SQL 案例四
目录案例四需求代码实现案例四需求从Kafka中消费数据并过滤出状态为success的数据再写入到Kafka {"user_id": "1", "page_id":"1", "status": "success"} {"user_id": "1", "page_id":"1", "...

Lansonli
发表于2021-09-29 00:24:15
2961 0 0

2.9k 0 0

目录案例四需求代码实现案例四需求从Kafka中消费数据并过滤出状态为success的数据再写入到Kafka {"user_id": "1", "page_id":"1", "status": "success"} {"user_id": "1", "page_id":"1", "...
Flink SQL 大数据
2021年大数据Flink（四）：Standalone独立集群模式
目录 Standalone独立集群模式原理操作 1.集群规划: 2.修改flink-conf.yaml 3.修改masters 4.修改slaves 5.添加HADOOP_CONF_DIR环境变量 6.分发 7.source 测试 1.启动集群，在node1上执行如下命令 2.启动历史服务器 ...

Lansonli
发表于2021-09-29 00:23:12
3379 0 0

3.3k 0 0

目录 Standalone独立集群模式原理操作 1.集群规划: 2.修改flink-conf.yaml 3.修改masters 4.修改slaves 5.添加HADOOP_CONF_DIR环境变量 6.分发 7.source 测试 1.启动集群，在node1上执行如下命令 2.启动历史服务器 ...
Flink 大数据
2021年大数据Flink（二十）：案例二基于数量的滚动和滑动窗口
目录案例二基于数量的滚动和滑动窗口需求代码实现案例二基于数量的滚动和滑动窗口需求需求1:统计在最近5条消息中,各自路口通过的汽车数量,相同的key每出现5次进行统计--基于数量的滚动窗口需求2:统计在最近5条消息中,各自路口通过的汽车数量,相同的key每出现3次进行统计--基于数量的滑动窗...

Lansonli
发表于2021-09-29 00:20:25
3037 0 0

3.0k 0 0

目录案例二基于数量的滚动和滑动窗口需求代码实现案例二基于数量的滚动和滑动窗口需求需求1:统计在最近5条消息中,各自路口通过的汽车数量,相同的key每出现5次进行统计--基于数量的滚动窗口需求2:统计在最近5条消息中,各自路口通过的汽车数量,相同的key每出现3次进行统计--基于数量的滑动窗...
Flink 大数据
2021年大数据Flink（二十二）：Time与Watermaker
目录 Flink-Time与Watermaker Time分类 EventTime的重要性示例1 示例2 示例3 示例4 总结 Watermaker水印机制/水位线机制什么是Watermaker？如何计算Watermaker？ Water...

Lansonli
发表于2021-09-29 00:16:12
2860 0 0

2.8k 0 0

目录 Flink-Time与Watermaker Time分类 EventTime的重要性示例1 示例2 示例3 示例4 总结 Watermaker水印机制/水位线机制什么是Watermaker？如何计算Watermaker？ Water...
Flink 大数据
2021年大数据Flink（十九）：案例一基于时间的滚动和滑动窗口
目录案例一基于时间的滚动和滑动窗口需求代码实现案例一基于时间的滚动和滑动窗口需求 nc -lk 9999 有如下数据表示: 信号灯编号和通过该信号灯的车的数量 9,3 9,2 9,7 4,9 2,6 1,5 2,3 5,7 5,4 需求1:每5秒钟统计一次，最近5秒钟内，各个路口通过红...

Lansonli
发表于2021-09-28 23:50:47
3069 0 0

3.0k 0 0

目录案例一基于时间的滚动和滑动窗口需求代码实现案例一基于时间的滚动和滑动窗口需求 nc -lk 9999 有如下数据表示: 信号灯编号和通过该信号灯的车的数量 9,3 9,2 9,7 4,9 2,6 1,5 2,3 5,7 5,4 需求1:每5秒钟统计一次，最近5秒钟内，各个路口通过红...
Flink 大数据
2021年大数据Flink（二十四）：Allowed Lateness案例演示
Allowed Lateness案例演示需求有订单数据,格式为: (订单ID，用户ID，时间戳/事件时间，订单金额) 要求每隔5s,计算5秒内，每个用户的订单总金额并添加Watermaker来解决一定程度上的数据延迟和数据乱序问题。并使用OutputTag+allowedLateness解决数据丢失问题 ...

Lansonli
发表于2021-09-28 23:41:49
2949 0 0

2.9k 0 0

Allowed Lateness案例演示需求有订单数据,格式为: (订单ID，用户ID，时间戳/事件时间，订单金额) 要求每隔5s,计算5秒内，每个用户的订单总金额并添加Watermaker来解决一定程度上的数据延迟和数据乱序问题。并使用OutputTag+allowedLateness解决数据丢失问题 ...
Flink 大数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript