Flink_标签_开发者

Hudi源码分析之使用Flink Table/SQL实现Hudi Sources

在文章Flink Table/SQL自定义Sources和Sinks全解析（附代码）中我们说到在Flink Table/SQL中如何自定义Sources和Sinks，有了上述文章的基础，我们再来理解Flink Table/SQL是如何实现Hudi的数据读取与写入就比较容易了。动态表是自定义sources/sinks的核心，通过查阅源码我们可以知道在flink-hudi子模块中，org.apa...

从大数据到人工智能

发表于2022-01-22 16:09:00

4225 0 1

4.2k 0 1

在文章Flink Table/SQL自定义Sources和Sinks全解析（附代码）中我们说到在Flink Table/SQL中如何自定义Sources和Sinks，有了上述文章的基础，我们再来理解Flink Table/SQL是如何实现Hudi的数据读取与写入就比较容易了。动态表是自定义sources/sinks的核心，通过查阅源码我们可以知道在flink-hudi子模块中，org.apa...

Flink SQL

Flink SQL Client实战CDC数据入湖

总览本文使用datafaker工具生成数据发送到MySQL，通过flink cdc工具将mysql binlog数据发送到kafka，最后再从kafka中读取数据并写入到hudi中。与此同时，在将数据写入到hudi中时，同步进行查询。组件版本与依赖datafaker 0.6.3mysql 5.7zookeeper 3.6.3kafka 2.8.0hadoop 3.2.0flink 1.1...

从大数据到人工智能

发表于2022-01-12 19:11:54

4580 0 1

4.5k 0 1

总览本文使用datafaker工具生成数据发送到MySQL，通过flink cdc工具将mysql binlog数据发送到kafka，最后再从kafka中读取数据并写入到hudi中。与此同时，在将数据写入到hudi中时，同步进行查询。组件版本与依赖datafaker 0.6.3mysql 5.7zookeeper 3.6.3kafka 2.8.0hadoop 3.2.0flink 1.1...

Flink SQL

图数据库的易用性—GES与Flink的对接

GES-Flink-Connector是一款自定义的离线/实时数据同步Flink连接器（connector），用于外部数据源与GES图数据库的数据同步。

你好_TT

发表于2021-12-29 18:00:35

12141 1 0

12.1k 1 0

GES-Flink-Connector是一款自定义的离线/实时数据同步Flink连接器（connector），用于外部数据源与GES图数据库的数据同步。

EI企业智能 Flink 图引擎服务 GES 数据库

华为FusionInsight MRS Flink客户端配置

使用华为FusionInsight MRS的Flink组件进行开发工作时，需要了解如何配置Flink客户端。本文将介绍如何进行该配置。

晋红轻

发表于2021-12-29 11:06:52

11659 0 0

11.6k 0 0

使用华为FusionInsight MRS的Flink组件进行开发工作时，需要了解如何配置Flink客户端。本文将介绍如何进行该配置。

EI企业智能 Flink FusionInsight MapReduce

Flink Solt优化需求与方案

需求描述Slot可以认为是taskmanager上面一块独立分配的资源，是taskmanager并行执行的能力的体现。Taskmanager中有两种使用slot的方法：一个taskmanager中设置了一个slot。一个taskmanager中设置了多个slot。每个task slot 表示TaskManager 拥有资源的一个固定大小的子集。假如一个taskManager 有三个slot，...

FI小粉丝

发表于2021-11-27 17:22:02

12572 0 0

12.5k 0 0

需求描述Slot可以认为是taskmanager上面一块独立分配的资源，是taskmanager并行执行的能力的体现。Taskmanager中有两种使用slot的方法：一个taskmanager中设置了一个slot。一个taskmanager中设置了多个slot。每个task slot 表示TaskManager 拥有资源的一个固定大小的子集。假如一个taskManager 有三个slot，...

EI企业智能 Flink FusionInsight JVM

Flink Scala项目快速入门

开发人员可以利用Scala的Actor模型在JVM上设计具伸缩性的并发应用程序，它会自动获得多核心处理器带来的优势，而不必依照复杂的Java线程模型来编写程序。本文重点讲解如何在用Maven来创建Scala语言的Flink入门项目模板，并在IDEA中进行调试运行。

jackwangcumt

发表于2021-11-25 08:16:14

9194 0 4

9.1k 0 4

开发人员可以利用Scala的Actor模型在JVM上设计具伸缩性的并发应用程序，它会自动获得多核心处理器带来的优势，而不必依照复杂的Java线程模型来编写程序。本文重点讲解如何在用Maven来创建Scala语言的Flink入门项目模板，并在IDEA中进行调试运行。

Flink Scala

Flink Standalone运行模式

Flink是一个开源的大数据框架和分布式处理引擎，它由Apache软件基金会开源，用于在无界和有界流数据上进行有状态的计算。本文在Linux操作系统上搭建了单机运行的Flink部署环境，并给出了基本的字数统计示例。

jackwangcumt

发表于2021-11-25 07:55:35

5480 0 4

5.4k 0 4

Flink是一个开源的大数据框架和分布式处理引擎，它由Apache软件基金会开源，用于在无界和有界流数据上进行有状态的计算。本文在Linux操作系统上搭建了单机运行的Flink部署环境，并给出了基本的字数统计示例。

Flink Linux

Ambari部署Flink

这个比较靠谱，下面操作的是单机https://blog.csdn.net/high2011/article/details/90272331从github上clone ambari-flink-service到对应目录sudo git clone https://github.com/abajwa-hw/ambari-flink-service.git /var/lib/ambari-s...

李子捌

发表于2021-11-24 20:04:32

5288 0 0

5.2k 0 0

这个比较靠谱，下面操作的是单机https://blog.csdn.net/high2011/article/details/90272331从github上clone ambari-flink-service到对应目录sudo git clone https://github.com/abajwa-hw/ambari-flink-service.git /var/lib/ambari-s...

Flink 大数据

Flink对接HBase常见问题

1.1.1 Flink任务运行一段时间后卡住但未失败问题现象Flink的运行日志发现，任务运行一段时间后持续打印以下日志：RPC Server Kerberos principal name for service=ClientService is hbase/xxxx.xxxx.xxx.com并且没有出现其它错误。可能原因HBase在认证过程中缓存中的票据信息没有更新，导致HBase一直...

FI小粉丝

发表于2021-09-29 14:59:45

5381 0 0

5.3k 0 0

1.1.1 Flink任务运行一段时间后卡住但未失败问题现象Flink的运行日志发现，任务运行一段时间后持续打印以下日志：RPC Server Kerberos principal name for service=ClientService is hbase/xxxx.xxxx.xxx.com并且没有出现其它错误。可能原因HBase在认证过程中缓存中的票据信息没有更新，导致HBase一直...

EI企业智能 Flink FusionInsight HBase

Flink StreamGraph生成

DataStreamDataStream通过Map、flatMap、filter等转换，而所有的转换在提交任务前都缓存在env的operators中（Operators将一个或多个dataStream转换成新的dataStream）代码解析以flatMap为例需要注意的是 keyBy、shuffle、rebalance不会发生datastream转换https://ci.apache.org...

CMT

发表于2021-07-28 17:47:55

9822 0 0

9.8k 0 0

DataStreamDataStream通过Map、flatMap、filter等转换，而所有的转换在提交任务前都缓存在env的operators中（Operators将一个或多个dataStream转换成新的dataStream）代码解析以flatMap为例需要注意的是 keyBy、shuffle、rebalance不会发生datastream转换https://ci.apache.org...

EI智能体 Flink FusionInsight

Flink1.12.2内存参数计算

JM内存参数参数默认值解释jobmanager.memory.process.sizeNoneJM的总内存如果没有设置，会使用旧的配置jobmanager.heap.sizejobmanager.memory.flink.sizeNonejobmanager.memory.process.size= jobmanager.memory.flink.size+ JVM Metaspace an...

CMT

发表于2021-07-28 17:24:59

8261 0 0

8.2k 0 0

JM内存参数参数默认值解释jobmanager.memory.process.sizeNoneJM的总内存如果没有设置，会使用旧的配置jobmanager.heap.sizejobmanager.memory.flink.sizeNonejobmanager.memory.process.size= jobmanager.memory.flink.size+ JVM Metaspace an...

EI企业智能 Flink FusionInsight

Flink容错机制

Flink 容错机制主要有作业执行的容错以及守护进程的容错两方面，前者包括 Flink runtime 的 ExecutionGraph 和Execution的容错，后者则包括 JobManager 和 TaskManager 的容错。一、作业执行容错 Flink 的错误恢复机制分为多个级别，即 Execution 级别的 Failover 策略和 ExecutionG...

yangxiao_mrs

发表于2021-06-25 11:09:19

11984 0 1

11.9k 0 1

Flink 容错机制主要有作业执行的容错以及守护进程的容错两方面，前者包括 Flink runtime 的 ExecutionGraph 和Execution的容错，后者则包括 JobManager 和 TaskManager 的容错。一、作业执行容错 Flink 的错误恢复机制分为多个级别，即 Execution 级别的 Failover 策略和 ExecutionG...

EI企业智能 Flink FusionInsight

【DLI】Flink作业重启后，如何保证不丢失数据？

DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，不丢失数据。为了避免系统故障导致作业异常自动重启后，丢失数据：对于Flink SQL作业，您可以勾选“开启Checkpoint”，并合理配置Checkpoint间隔（权衡执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，...

数据湖爱好者

发表于2021-05-27 09:58:38

13679 0 0

13.6k 0 0

DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，不丢失数据。为了避免系统故障导致作业异常自动重启后，丢失数据：对于Flink SQL作业，您可以勾选“开启Checkpoint”，并合理配置Checkpoint间隔（权衡执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，...

EI企业智能 Flink 数据湖探索 DLI 智能数据

【DLI】Flink作业推荐配置指导

用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2 添加订阅登录DLI控制台，创建Flink SQL作业，编写作业SQL后，配置“运行参数”。说明：Flink Jar作业可靠性配置与SQL作业相同...

数据湖爱好者

发表于2021-05-27 09:56:25

8220 0 0

8.2k 0 0

用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2 添加订阅登录DLI控制台，创建Flink SQL作业，编写作业SQL后，配置“运行参数”。说明：Flink Jar作业可靠性配置与SQL作业相同...

EI企业智能 Flink 数据湖探索 DLI 智能数据

DLI Flink作业生产环境推荐配置指导

DLI Flink作业要如何配置才能稳定可靠，安心上生产环境呢？

Yunz Bao

发表于2021-04-23 11:57:33

8519 0 0

8.5k 0 0

DLI Flink作业要如何配置才能稳定可靠，安心上生产环境呢？

Flink 数据湖探索 DLI