MapReduce_标签_开发者

博客(445)
视频(0)
论坛(0)
云声(0)
代码示例(0)

基于云服务MRS构建DolphinScheduler2调度系统
Apache DolphinScheduler(海豚调度)：国人之光，是许多国人雷锋开源在Apache的顶级项目，主要功能就是负责任务的调度处理。云服务MRS：华为云提供的一站式大数据平台，包含Hudi、ClickHouse、Spark、Flink、Kafka、HBase等丰富的大数据组件，完全兼容开源生态。本文介绍如何搭建DolphinScheduler并运行MRS作业

啊喔YeYe
发表于2022-05-27 16:25:18
10018 3 3

10.0k 3 3

Apache DolphinScheduler(海豚调度)：国人之光，是许多国人雷锋开源在Apache的顶级项目，主要功能就是负责任务的调度处理。云服务MRS：华为云提供的一站式大数据平台，包含Hudi、ClickHouse、Spark、Flink、Kafka、HBase等丰富的大数据组件，完全兼容开源生态。本文介绍如何搭建DolphinScheduler并运行MRS作业
MapReduce
【细节拉满】Hadoop课程设计项目，使用idea编写基于MapReduce的学生成绩分析系统(附带源码、项目文件下载地址)
目录 1 数据源(学生成绩.csv)2 hadoop平台上传数据源3 idea代码3.1 工程框架3.2 导入依赖3.3 系统主入口(menu)3.4 六个mapreduce3.4.1 计算每门成绩的最高分、最低分、平均分(Mma)3.4.2 计算每个学生的总分及平均成绩并进行排序(Sas)3.4.3 统计所有学生的信息(Si)3.4.4 统计每门课程中相同分数分布情况(Css)3.4.5...

扎哇太枣糕
发表于2022-05-13 14:07:21
6762 0 0

6.7k 0 0

目录 1 数据源(学生成绩.csv)2 hadoop平台上传数据源3 idea代码3.1 工程框架3.2 导入依赖3.3 系统主入口(menu)3.4 六个mapreduce3.4.1 计算每门成绩的最高分、最低分、平均分(Mma)3.4.2 计算每个学生的总分及平均成绩并进行排序(Sas)3.4.3 统计所有学生的信息(Si)3.4.4 统计每门课程中相同分数分布情况(Css)3.4.5...
Hadoop IDE MapReduce 大数据
使用idea基于MapReduce的统计数据分析(从问题分析到代码编写)
目录1 编程前总分析1.1 数据源1.2 需要掌握的知识1.2.1 Hadoop对比java的数据类型1.2.2 MapReduce流程简介 1.3.3 MapReduce流程细分2 编码阶段2.1 导入依赖2.2 mapper2.3 reducer2.4 main1 编程前总分析1.1 数据源英语,李沐,85,男,20数学,李沐,54,男,20音乐,李沐,54,男,20体育,李沐,34,...

扎哇太枣糕
发表于2022-05-13 14:06:09
5624 0 0

5.6k 0 0

目录1 编程前总分析1.1 数据源1.2 需要掌握的知识1.2.1 Hadoop对比java的数据类型1.2.2 MapReduce流程简介 1.3.3 MapReduce流程细分2 编码阶段2.1 导入依赖2.2 mapper2.3 reducer2.4 main1 编程前总分析1.1 数据源英语,李沐,85,男,20数学,李沐,54,男,20音乐,李沐,54,男,20体育,李沐,34,...
IDE MapReduce 大数据数据库数据挖掘
MRS3.1.3-LTS 交互式分析引擎HetuEngine新特性之物化视图的自动刷新功能
一. 为什么要支持自动刷新物化视图？HetuEngine 3.1.3版本支持物化视图的创建和自动使用物化视图对查询SQL进行改写优化能力。使用物化视图提供的预计算能力能极大地提高查询效率，但是预计算也同时带来了数据的一致性问题。为了保证物化视图数据和源数据的一致性，物化视图需要被定时刷新。为了提升物化视图的易用性，减少需要定期刷新物化视图的麻烦，HetuEngine支持创建自动定期刷新的物...

HetuEngine九级代言
发表于2022-05-08 12:37:16
9474 0 0

9.4k 0 0

一. 为什么要支持自动刷新物化视图？HetuEngine 3.1.3版本支持物化视图的创建和自动使用物化视图对查询SQL进行改写优化能力。使用物化视图提供的预计算能力能极大地提高查询效率，但是预计算也同时带来了数据的一致性问题。为了保证物化视图数据和源数据的一致性，物化视图需要被定时刷新。为了提升物化视图的易用性，减少需要定期刷新物化视图的麻烦，HetuEngine支持创建自动定期刷新的物...
EI企业智能 FusionInsight HetuEngine MapReduce 大数据
MapReduce服务初体验【玩转华为云】
1、概述1.1、什么是MapReduce？大数据是人类进入互联网时代以来面临的一个巨大问题：社会生产生活产生的数据量越来越大，数据种类越来越多，数据产生的速度越来越快。传统的数据处理技术，比如说单机存储，关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题，Apache基金会推出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台，可以充分利用集群的...

nukinsan
发表于2022-04-25 23:14:35
8462 0 0

8.4k 0 0

1、概述1.1、什么是MapReduce？大数据是人类进入互联网时代以来面临的一个巨大问题：社会生产生活产生的数据量越来越大，数据种类越来越多，数据产生的速度越来越快。传统的数据处理技术，比如说单机存储，关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题，Apache基金会推出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台，可以充分利用集群的...
MapReduce MapReduce服务 MRS 大数据
Spark架构原理
相比MapReduce僵化的Map与Reduce分阶段计算相比，Spark的计算框架更加富有弹性和灵活性，运行性能更佳。 1 Spark的计算阶段MapReduce一个应用一次只运行一个map和一个reduceSpark可根据应用的复杂度，分割成更多的计算阶段（stage），组成一个有向无环图DAG，Spark任务调度器可根据DAG的依赖关系执行计算阶段逻辑回归机器学习性能Spark比Map...

JavaEdge
发表于2022-04-19 20:56:31
8650 0 1

8.6k 0 1

相比MapReduce僵化的Map与Reduce分阶段计算相比，Spark的计算框架更加富有弹性和灵活性，运行性能更佳。 1 Spark的计算阶段MapReduce一个应用一次只运行一个map和一个reduceSpark可根据应用的复杂度，分割成更多的计算阶段（stage），组成一个有向无环图DAG，Spark任务调度器可根据DAG的依赖关系执行计算阶段逻辑回归机器学习性能Spark比Map...
MapReduce spark
Hive如何让MapReduce实现SQL操作
Hive如何让MapReduce实现SQL操作MapReduce简化了大数据编程的难度，使得大数据计算不再是高不可攀的技术圣殿，普通工程师也能使用MapReduce开发大数据程序。但是对于经常需要进行大数据计算的人，比如从事研究商业智能（BI）的数据分析师来说，他们通常使用SQL进行大数据分析和统计，MapReduce编程还是有一定的门槛。而且如果每次统计和分析都开发相应的MapReduce...

JavaEdge
发表于2022-04-15 22:48:24
7427 0 1

7.4k 0 1

Hive如何让MapReduce实现SQL操作MapReduce简化了大数据编程的难度，使得大数据计算不再是高不可攀的技术圣殿，普通工程师也能使用MapReduce开发大数据程序。但是对于经常需要进行大数据计算的人，比如从事研究商业智能（BI）的数据分析师来说，他们通常使用SQL进行大数据分析和统计，MapReduce编程还是有一定的门槛。而且如果每次统计和分析都开发相应的MapReduce...
Hive MapReduce SQL
FusionInsight MRS HetuEngine使用HBase数据源
操作场景本章节指导用户在HSConsole界面添加HBase数据源。前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。已创建HetuEngine计算实例。数据源所在集群与HetuEngine所在集群上ZooKeeper的SSL通信加密配置需保持一致。FusionInsight Manager 8.1.2之前的版本，SSL通...

一枚核桃
发表于2022-01-14 14:48:47
11312 0 0

11.3k 0 0

操作场景本章节指导用户在HSConsole界面添加HBase数据源。前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。已创建HetuEngine计算实例。数据源所在集群与HetuEngine所在集群上ZooKeeper的SSL通信加密配置需保持一致。FusionInsight Manager 8.1.2之前的版本，SSL通...
FusionInsight HBase MapReduce
华为FusionInsight MRS实战 - Flink增强特性之可视化开发平台FlinkSever开发学习
华为Flink可视化开发平台FlinkServer作为自研服务，能够提供比原生flinksql接口更强的企业级特性，比如任务的集中管理，可视化开发，多数据源配置等。本文将对比介绍体现flinkserver的优势。

晋红轻
发表于2021-12-29 11:09:52
16043 0 0

16.0k 0 0

华为Flink可视化开发平台FlinkServer作为自研服务，能够提供比原生flinksql接口更强的企业级特性，比如任务的集中管理，可视化开发，多数据源配置等。本文将对比介绍体现flinkserver的优势。
EI企业智能 Flink FusionInsight MapReduce SQL
华为FusionInsight MRS FlinkSQL 复杂嵌套Json解析最佳实践
本文学习如何使用flinksql语法解析复杂嵌套的json格式内容。

晋红轻
发表于2021-12-29 11:05:34
11621 0 0

11.6k 0 0

本文学习如何使用flinksql语法解析复杂嵌套的json格式内容。
EI企业智能 FusionInsight MapReduce
华为FusionInsight MRS Manager rest接口进阶学习
本文学习如何使用rest接口访问FusionInsight MRS 组件界面信息。

晋红轻
发表于2021-12-29 11:03:46
11067 0 0

11.0k 0 0

本文学习如何使用rest接口访问FusionInsight MRS 组件界面信息。
EI企业智能 FusionInsight MapReduce
华为FusionInsight MRS Manager rest接口基础学习
FusionInsight Manager是集群的运维管理系统，为部署在集群内的服务提供统一的集群管理能力。本文学习使用基本的rest接口访问manager。

晋红轻
发表于2021-12-29 11:01:47
13158 0 0

13.1k 0 0

FusionInsight Manager是集群的运维管理系统，为部署在集群内的服务提供统一的集群管理能力。本文学习使用基本的rest接口访问manager。
EI企业智能 FusionInsight MapReduce
FusionInsight MRS Hudi原理解析之Compaction
Hudi的Compaction作用Hudi的Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，Merge-On-Read表可减少数据摄入延迟，更新被记录到增量文件，但是随着行式数据的不断增长，为加快分析效率，需要对列式文件和行式文件的合并（compaction）生成新版本的列式文件，提升数据访问的性能。因而进行Compaction很有意义。Compactio...

一枚核桃
发表于2021-12-28 10:49:30
10931 0 0

10.9k 0 0

Hudi的Compaction作用Hudi的Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，Merge-On-Read表可减少数据摄入延迟，更新被记录到增量文件，但是随着行式数据的不断增长，为加快分析效率，需要对列式文件和行式文件的合并（compaction）生成新版本的列式文件，提升数据访问的性能。因而进行Compaction很有意义。Compactio...
EI企业智能 FusionInsight MapReduce
Flink第一课！使用批处理，流处理，Socket的方式实现经典词频统计
Flink是什么Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。 Flink的特点支持事件时间（event-time）和处理时间（processing-time）语义精确一次（exactly-once）的状态一致性保证低延迟，每秒处理数百万个事件，毫秒级延迟与众多常用存储系统的连接高可用，动态扩展，实现7*24小时全天候运行 Flink的全球热度 F...

大数据小禅
发表于2021-12-19 22:41:00
6580 0 0

6.5k 0 0

Flink是什么Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。 Flink的特点支持事件时间（event-time）和处理时间（processing-time）语义精确一次（exactly-once）的状态一致性保证低延迟，每秒处理数百万个事件，毫秒级延迟与众多常用存储系统的连接高可用，动态扩展，实现7*24小时全天候运行 Flink的全球热度 F...
Flink MapReduce Socket编程
【云驻共创】告诉你如何学习Loader数据转换
介绍了Loader的主要功能及其主要特性，然后介绍了Loader的作业管理和监控。大数据平台与外部数据源的交互，通过MapReduce并行处理，完成数据的导入与导出功能。

Mr红凯
发表于2021-12-19 16:09:18
13936 0 0

13.9k 0 0

介绍了Loader的主要功能及其主要特性，然后介绍了Loader的作业管理和监控。大数据平台与外部数据源的交互，通过MapReduce并行处理，完成数据的导入与导出功能。
Hadoop MapReduce

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript