Flink_标签_开发者

大数据Flink进阶（三）：Flink核心特性

Flink核心特性Flink具有先进的架构理念，拥有诸多的优秀特性以及完善的编程接口，Flink的优势有以下几点：一、批流一体化Flink可以在底层用同样的数据抽象和计算模型来进行批处理和流处理。事实上，Flink在设计理念上没有刻意强调批处理和流处理，而更多的强调数据的有界和无界，这就意味着Flink能够满足企业业务需求，无需用两种甚至多种框架分别实现批处理和流处理，这大大降低了架构设计、...

Lansonli

发表于2023-03-19 11:55:54

2867 0 1

2.8k 0 1

Flink核心特性Flink具有先进的架构理念，拥有诸多的优秀特性以及完善的编程接口，Flink的优势有以下几点：一、批流一体化Flink可以在底层用同样的数据抽象和计算模型来进行批处理和流处理。事实上，Flink在设计理念上没有刻意强调批处理和流处理，而更多的强调数据的有界和无界，这就意味着Flink能够满足企业业务需求，无需用两种甚至多种框架分别实现批处理和流处理，这大大降低了架构设计、...

Flink 大数据

大数据Flink进阶（四）：Flink应用场景以及其他实时计算框架对比

Flink应用场景以及其他实时计算框架对比一、Flink应用场景在实际生产的过程中，大量数据在不断地产生，例如金融交易数据、互联网订单数据、GPS定位数据、传感器信号、移动终端产生的数据、通信信号数据等，以及我们熟悉的网络流量监控、服务器产生的日志数据，这些数据最大的共同点就是实时从不同的数据源中产生，然后再传输到下游的分析系统。针对这些数据类型主要包括实时智能推荐、复杂事件处理、实时欺诈...

Lansonli

发表于2023-03-19 11:51:31

3518 0 1

3.5k 0 1

Flink应用场景以及其他实时计算框架对比一、Flink应用场景在实际生产的过程中，大量数据在不断地产生，例如金融交易数据、互联网订单数据、GPS定位数据、传感器信号、移动终端产生的数据、通信信号数据等，以及我们熟悉的网络流量监控、服务器产生的日志数据，这些数据最大的共同点就是实时从不同的数据源中产生，然后再传输到下游的分析系统。针对这些数据类型主要包括实时智能推荐、复杂事件处理、实时欺诈...

Flink 大数据应用与数据集成平台 ROMA Connect

大数据技术学习——Flink

Flink是分布式流数据处理引擎。

slx_share

发表于2023-03-02 11:37:08

7128 0 0

7.1k 0 0

Flink是分布式流数据处理引擎。

Flink 大数据

开源Flink Kafka Connector源码学习

本文通过阅读Kafka Connector代码的调用，分析了Kafka partition分配、Commit、线程模型等

想要一只猫

发表于2023-02-14 11:25:08

4274 0 0

4.2k 0 0

本文通过阅读Kafka Connector代码的调用，分析了Kafka partition分配、Commit、线程模型等

Flink Java Kafka 数据治理中心 DataArts Studio

美团：数据治理一体化实践之体系化建模

《数据如何治理呢》

龙哥手记

发表于2022-12-17 00:17:39

2594 0 0

2.5k 0 0

《数据如何治理呢》

Flink MySQL 数据库架构设计

Docker部署flink备忘

本文目的是给自己备忘的，在后面的工作和学习中若想快速搭建Flink环境用于开发，可以照此进行

程序员欣宸

发表于2022-11-21 08:30:09

2056 0 0

2.0k 0 0

本文目的是给自己备忘的，在后面的工作和学习中若想快速搭建Flink环境用于开发，可以照此进行

Docker Flink

Pyflink 1.14简介

本文主要介绍pyflink 1.14的一些特性

想要一只猫

发表于2022-05-29 00:07:00

8275 0 0

8.2k 0 0

本文主要介绍pyflink 1.14的一些特性

EI企业智能 Flink MapReduce服务 MRS Python 智能数据

MRS Flink使用SQL-Client对接Hive

一、准备环境1.根据产品文档安装Flink客户端；2.将sql-client-defaults.yaml放入/opt/client/Flink/flink/conf中3.将jaas.conf放入/opt/client/Flink/flink/conf中Client {com.sun.security.auth.module.Krb5LoginModule requireduseKeyTab=...

yangxiao_mrs

发表于2021-09-29 17:38:40

11265 1 2

11.2k 1 2

一、准备环境1.根据产品文档安装Flink客户端；2.将sql-client-defaults.yaml放入/opt/client/Flink/flink/conf中3.将jaas.conf放入/opt/client/Flink/flink/conf中Client {com.sun.security.auth.module.Krb5LoginModule requireduseKeyTab=...

EI企业智能 Flink FusionInsight

Flink对接ES常见问题

1.1.1 开启checkpoint并且自定义目录后任务运行24小时后checkpoint全部失败问题现象 Flink选择使用对接ES的任务在运行一段时间后checkpoint全部失败，而对接kafka能够正常运行。可能原因ES的认证模式跟其它场景不同，在运行一段时间后，票据信息会超时需要重新认证，此时ES中缓存的票据信息没有更新，导致跟HDFS中指定的目录无法正常认证。解决方案1.需要在...

FI小粉丝

发表于2021-09-29 14:57:45

5180 0 0

5.1k 0 0

1.1.1 开启checkpoint并且自定义目录后任务运行24小时后checkpoint全部失败问题现象 Flink选择使用对接ES的任务在运行一段时间后checkpoint全部失败，而对接kafka能够正常运行。可能原因ES的认证模式跟其它场景不同，在运行一段时间后，票据信息会超时需要重新认证，此时ES中缓存的票据信息没有更新，导致跟HDFS中指定的目录无法正常认证。解决方案1.需要在...

EI企业智能 Elasticsearch Flink FusionInsight

【案例分享】Kafka异常分区修复典型场景

【问题描述】Flink对接消费Kafka数据时，任务超时失败，Flink的JobManager日志上报“org.apache.kafka.common.errors.TimeoutException: Timeout of 60000ms expired before the position for partition trafficgo_realtime_traffic-0 could ...

南派三叔

发表于2021-07-23 16:01:55

22939 0 0

22.9k 0 0

【问题描述】Flink对接消费Kafka数据时，任务超时失败，Flink的JobManager日志上报“org.apache.kafka.common.errors.TimeoutException: Timeout of 60000ms expired before the position for partition trafficgo_realtime_traffic-0 could ...

EI企业智能 Flink FusionInsight Kafka

Flink 1.10内核源码梳理-client提交作业流程源码梳理

以flink1.10开源代码未例子。梳理flink client提交作业的源码流程 1、/bin/flink run xxx用户通过flink client的命令行工具提交作业flink只是个shell脚本，原理就是调用如下类 org.apache.flink.client.cli.CliFrontend “$@” 2、CliFrontend的main()函数内部逻辑getConfigura...

芳萌萌芳

发表于2021-06-29 23:47:17

8153 0 0

8.1k 0 0

以flink1.10开源代码未例子。梳理flink client提交作业的源码流程 1、/bin/flink run xxx用户通过flink client的命令行工具提交作业flink只是个shell脚本，原理就是调用如下类 org.apache.flink.client.cli.CliFrontend “$@” 2、CliFrontend的main()函数内部逻辑getConfigura...

Flink

从“数据堆积如山”到“实时驱动业务”——聊聊Kafka到Flink的实时数据处理演进

Echo_Wish

发表于2025-11-11 21:41:32

275 0 0

从“数据堆积如山”到“实时驱动业务”——聊聊Kafka到Flink的实时数据处理演进

Flink Kafka

Flink SQL在实时数仓中的应用

随着大数据时代的到来，企业对数据处理的实时性要求越来越高。传统的批处理模式已经无法满足现代业务的需求，实时数据仓库（Real-time Data Warehouse）应运而生。Apache Flink作为一款优秀的流处理框架，其SQL接口为构建实时数仓提供了强大而便捷的能力。实时数仓的核心价值与挑战实时数仓的核心价值在于能够帮助企业实现数据的即时洞察，支持快速决策。相比传统的离线数仓，实时...

超梦

发表于2025-11-07 12:40:56

106 0 0

随着大数据时代的到来，企业对数据处理的实时性要求越来越高。传统的批处理模式已经无法满足现代业务的需求，实时数据仓库（Real-time Data Warehouse）应运而生。Apache Flink作为一款优秀的流处理框架，其SQL接口为构建实时数仓提供了强大而便捷的能力。实时数仓的核心价值与挑战实时数仓的核心价值在于能够帮助企业实现数据的即时洞察，支持快速决策。相比传统的离线数仓，实时...

Flink SQL

Flink Table API与SQL的最佳实践

在实时数据处理领域，Apache Flink凭借其低延迟、高吞吐的流处理能力成为行业标杆。而Flink的Table API与SQL作为统一的声明式接口，极大简化了流批一体应用的开发。它们让开发者无需深入底层DataStream API细节，就能高效构建复杂的数据管道。然而，许多团队在实践中常因类型系统混淆、性能瓶颈或API选择不当导致项目延期。本文将从核心理念出发，结合最佳实践与案例，助你避...

超梦

发表于2025-11-06 12:35:11

152 0 0

在实时数据处理领域，Apache Flink凭借其低延迟、高吞吐的流处理能力成为行业标杆。而Flink的Table API与SQL作为统一的声明式接口，极大简化了流批一体应用的开发。它们让开发者无需深入底层DataStream API细节，就能高效构建复杂的数据管道。然而，许多团队在实践中常因类型系统混淆、性能瓶颈或API选择不当导致项目延期。本文将从核心理念出发，结合最佳实践与案例，助你避...

API Flink Java SQL 大数据

Flink自定义函数：UDF、UDAF和UDTF实战

在实时数据处理领域，Apache Flink 作为一款高性能流处理框架，凭借其低延迟、高吞吐的特性，已成为企业级实时计算的首选工具。然而，面对多样化的业务需求，Flink 内置的函数往往难以覆盖所有场景。此时，自定义函数（User-Defined Functions, UDFs）便成为扩展 Flink 能力的核心利器。它们允许开发者灵活注入业务逻辑，将复杂处理逻辑无缝集成到 Flink 作业...

超梦

发表于2025-11-04 12:39:48

158 0 0

在实时数据处理领域，Apache Flink 作为一款高性能流处理框架，凭借其低延迟、高吞吐的特性，已成为企业级实时计算的首选工具。然而，面对多样化的业务需求，Flink 内置的函数往往难以覆盖所有场景。此时，自定义函数（User-Defined Functions, UDFs）便成为扩展 Flink 能力的核心利器。它们允许开发者灵活注入业务逻辑，将复杂处理逻辑无缝集成到 Flink 作业...

Flink