MapReduce_标签_开发者

博客(445)
视频(0)
论坛(0)
云声(0)
代码示例(0)

【云驻共创】一文告诉你华为云上大数据处理与分析(详细)
本章主要讲述华为云大数据解决方案，云上大数据处理与分析方法。介绍了华为云EI主流大数据服务，如MRS服务、DWS服务和CSS服务。由此引出两种常见的大数据解决方案，离线处理和实时流处理，并对它们的架构优势、实现原理、应用分析与案例场景进行讲解。最后对DAYU数据运营平台进行了介绍。

菜鸟级攻城狮
发表于2021-12-09 11:55:33
11633 0 0

11.6k 0 0

本章主要讲述华为云大数据解决方案，云上大数据处理与分析方法。介绍了华为云EI主流大数据服务，如MRS服务、DWS服务和CSS服务。由此引出两种常见的大数据解决方案，离线处理和实时流处理，并对它们的架构优势、实现原理、应用分析与案例场景进行讲解。最后对DAYU数据运营平台进行了介绍。
MapReduce 大数据
带你体验沙箱实验室的基于Spark实现车主驾驶行为分析丨【我的华为云体验之旅】
通过体验沙箱实验室的基于Spark实现车主驾驶行为分析实验后，我们可以从中学习MRS服务的创建过程，学习把文件数据上传到OBS，通过MRS里面创建作业类型为SparkSubmit，实现车主急加速、急刹车、空挡滑行、超速、疲劳驾驶等违法行为的次数的统计分析。

zekelove
发表于2021-12-02 14:29:50
15447 0 1

15.4k 0 1

通过体验沙箱实验室的基于Spark实现车主驾驶行为分析实验后，我们可以从中学习MRS服务的创建过程，学习把文件数据上传到OBS，通过MRS里面创建作业类型为SparkSubmit，实现车主急加速、急刹车、空挡滑行、超速、疲劳驾驶等违法行为的次数的统计分析。
MapReduce spark 对象存储服务 OBS
如何为MRS_3.x版本的Spark添加三方依赖包
MRS上使用spark提交任务经常引入一些三方依赖包，本文主要介绍几种添加依赖包的方式。

泽及天下不为仁
发表于2021-10-11 20:38:51
13063 0 0

13.0k 0 0

MRS上使用spark提交任务经常引入一些三方依赖包，本文主要介绍几种添加依赖包的方式。
MapReduce spark
clickhouse存算分离在华为云实践
clickhouse是一款非常优秀的OLAP数据库系统，2016年刚开源的时候就因为卓越的性能表现得到大家的关注，而近两年国内互联网公司的大规模应用和推广，使得它在业内声名鹊起，且受到了大家一致的认可。从网络上公开分享的资料和客户使用的案例总结来看，clickhouse主要是应用在实时数仓和离线加速两个场景，其中有些实时业务为了追求极致的性能会上全ssd的配置，考虑到实时数据集的有限规模，这.

he lifu
发表于2021-10-11 15:57:19
20185 0 0

20.1k 0 0

clickhouse是一款非常优秀的OLAP数据库系统，2016年刚开源的时候就因为卓越的性能表现得到大家的关注，而近两年国内互联网公司的大规模应用和推广，使得它在业内声名鹊起，且受到了大家一致的认可。从网络上公开分享的资料和客户使用的案例总结来看，clickhouse主要是应用在实时数仓和离线加速两个场景，其中有些实时业务为了追求极致的性能会上全ssd的配置，考虑到实时数据集的有限规模，这.
ClickHouse EI企业智能 MapReduce MapReduce服务 MRS 大数据
FusionInsight MRS的自研超级调度器Superior Scheduler原理简介
Superior Scheduler是一个专门为Hadoop YARN分布式资源管理系统设计的调度引擎，是针对企业客户融合资源池，多租户的业务诉求而设计的高性能企业级调度器。Superior Scheduler可实现开源调度器、Fair Scheduler以及Capacity Scheduler的所有功能。另外，相较于开源调度器，Superior Scheduler在企业级多租户调度策略、租...

一枚核桃
发表于2021-09-30 09:15:58
14873 0 0

14.8k 0 0

Superior Scheduler是一个专门为Hadoop YARN分布式资源管理系统设计的调度引擎，是针对企业客户融合资源池，多租户的业务诉求而设计的高性能企业级调度器。Superior Scheduler可实现开源调度器、Fair Scheduler以及Capacity Scheduler的所有功能。另外，相较于开源调度器，Superior Scheduler在企业级多租户调度策略、租...
EI企业智能 FusionInsight Hadoop MapReduce
FusionInsight MRS配置机架策略最佳实践
大型集群的所有主机通常分布在多个机架上，不同机架间的主机通过交换机进行数据通信，且同一机架上的不同机器间的网络带宽要远大于不同机架机器间的网络带宽。在这种情况下网络拓扑规划应满足不同主机之间的通信能够尽量发生在同一个机架之内，分布式服务的进程或数据需要尽可能存在多个机架的不同主机上这两个要求

一枚核桃
发表于2021-09-30 09:00:36
7691 0 0

7.6k 0 0

大型集群的所有主机通常分布在多个机架上，不同机架间的主机通过交换机进行数据通信，且同一机架上的不同机器间的网络带宽要远大于不同机架机器间的网络带宽。在这种情况下网络拓扑规划应满足不同主机之间的通信能够尽量发生在同一个机架之内，分布式服务的进程或数据需要尽可能存在多个机架的不同主机上这两个要求
EI企业智能 FusionInsight Hadoop MapReduce
华为FusionInsight MRS CDL使用指南
CDL是一种简单、高效的数据实时集成服务，能够从各种OLTP数据库中抓取Data Change事件，然后推送至Kafka中，最后由Sink Connector消费Topic中的数据并导入到大数据生态软件应用中，从而实现数据的实时入湖。

晋红轻
发表于2021-09-29 10:51:42
13534 0 1

13.5k 0 1

CDL是一种简单、高效的数据实时集成服务，能够从各种OLTP数据库中抓取Data Change事件，然后推送至Kafka中，最后由Sink Connector消费Topic中的数据并导入到大数据生态软件应用中，从而实现数据的实时入湖。
EI企业智能 FusionInsight MapReduce
Jmeter压测工具使用之HetuEngine测试
Jmeter压测工具使用之HetuEngine测试测试场景如图：使用jmeter同时向MRS集群内的两套HetuEngine计算集群进行10并发的压力测试，并将最后的测试结果统一 Jmeter配置测试计划配置线程组1的配置：Hetu JDBC connection Configuration配置：JDBC Request配置：Precise Throughout Timer配置：说明：使...

晋红轻
发表于2021-09-29 10:45:42
7539 0 0

7.5k 0 0

Jmeter压测工具使用之HetuEngine测试测试场景如图：使用jmeter同时向MRS集群内的两套HetuEngine计算集群进行10并发的压力测试，并将最后的测试结果统一 Jmeter配置测试计划配置线程组1的配置：Hetu JDBC connection Configuration配置：JDBC Request配置：Precise Throughout Timer配置：说明：使...
EI企业智能 FusionInsight MapReduce 大数据自动化测试
wxappUnpacker的bingo.bat脚本逐行解读
之前发过一篇文章小程序反编译工具在windows系统下的调用脚本提到了Windows平台下的脚本，但是对脚本没有做详细说明。本文就是针对脚本做的讲解。对批处理感兴趣的可以了解下。不会基础也没关系。下面我们进入正题。脚本解读第1行：# WXAPPUNPACKER_PATH 项目路径这段其实在 shell 文件中是注释内容，只不过在翻译这份脚本的时候是边查边写，复制过来没有修改，所以严格说这里属...

薛定喵君
发表于2021-09-24 20:41:47
11794 0 0

11.7k 0 0

之前发过一篇文章小程序反编译工具在windows系统下的调用脚本提到了Windows平台下的脚本，但是对脚本没有做详细说明。本文就是针对脚本做的讲解。对批处理感兴趣的可以了解下。不会基础也没关系。下面我们进入正题。脚本解读第1行：# WXAPPUNPACKER_PATH 项目路径这段其实在 shell 文件中是注释内容，只不过在翻译这份脚本的时候是边查边写，复制过来没有修改，所以严格说这里属...
MapReduce 机器翻译
Hadoop Streaming：用 Python 编写 Hadoop MapReduce 程序
随着数字媒体、物联网等发展的出现，每天产生的数字数据量呈指数级增长。这种情况给创建下一代工具和技术来存储和操作这些数据带来了挑战。这就是 Hadoop Streaming 的用武之地！下面给出的图表描绘了从 2013 年起全球每年产生的数据增长情况。 IDC 估计，到 2025 年，每年产生的数据量将达到 180 Zettabytes！

Donglian Lin
发表于2021-09-17 10:13:18
13590 0 1

13.5k 0 1

随着数字媒体、物联网等发展的出现，每天产生的数字数据量呈指数级增长。这种情况给创建下一代工具和技术来存储和操作这些数据带来了挑战。这就是 Hadoop Streaming 的用武之地！下面给出的图表描绘了从 2013 年起全球每年产生的数据增长情况。 IDC 估计，到 2025 年，每年产生的数据量将达到 180 Zettabytes！
Hadoop MapReduce Python
MapReduce 示例：减少 Hadoop MapReduce 中的侧连接
在排序和reducer 阶段，reduce 侧连接过程会产生巨大的网络I/O 流量，在这个阶段，相同键的值被聚集在一起。因此，如果您有大量具有数百万个值的不同数据集，您很可能会遇到 OutOfMemory 异常，即您的 RAM 已满，因此溢出。在我看来，使用reduce side join的优点是：

Donglian Lin
发表于2021-09-16 13:32:07
8856 0 0

8.8k 0 0

在排序和reducer 阶段，reduce 侧连接过程会产生巨大的网络I/O 流量，在这个阶段，相同键的值被聚集在一起。因此，如果您有大量具有数百万个值的不同数据集，您很可能会遇到 OutOfMemory 异常，即您的 RAM 已满，因此溢出。在我看来，使用reduce side join的优点是：
Hadoop MapReduce
FusionInsight二次开发安全认证原理和认证机制
功能开启了 Kerberos认证的安全模式集群，进行应用开发时需要进行安全认证。Kerberos这一名词来源于希腊神话“三个头的狗——地狱之门守护者”，后来沿用作为安全认证的概念，使用Kerberos的系统在设计上采用“客户端/服务器”结构与AES等加密技术，并且能够进行相互认证（即客户端和服务器端均可对对方进行身份认证）。可以用于防止窃听、防止replay攻击、保护数据完整性等场合，是一种...

一枚核桃
发表于2021-08-28 09:25:29
6527 0 0

6.5k 0 0

功能开启了 Kerberos认证的安全模式集群，进行应用开发时需要进行安全认证。Kerberos这一名词来源于希腊神话“三个头的狗——地狱之门守护者”，后来沿用作为安全认证的概念，使用Kerberos的系统在设计上采用“客户端/服务器”结构与AES等加密技术，并且能够进行相互认证（即客户端和服务器端均可对对方进行身份认证）。可以用于防止窃听、防止replay攻击、保护数据完整性等场合，是一种...
EI企业智能 FusionInsight MapReduce
华为MRS基于Hudi和HetuEngine构建实时数据湖最佳实践
本文介绍什么是华为FusionInsight MRS实时数据湖解决方案，以及案例最佳实践。

晋红轻
发表于2021-08-05 17:06:58
16976 0 4

16.9k 0 4

本文介绍什么是华为FusionInsight MRS实时数据湖解决方案，以及案例最佳实践。
EI企业智能 FusionInsight MapReduce
华为FusionInsight MRS实战 - Hudi实时入湖之DeltaStreamer工具最佳实践
本文介绍如何使用Hudi自带入湖工具DeltaStreamer进行数据的实时入湖。

晋红轻
发表于2021-07-31 11:31:05
11251 0 0

11.2k 0 0

本文介绍如何使用Hudi自带入湖工具DeltaStreamer进行数据的实时入湖。
EI企业智能 FusionInsight MapReduce
MRS IoTDB时序数据库的架构设计与实现（1）
MRS IoTDB是华为FusionInsight MRS大数据套件最新推出的时序数据库产品，其领先的设计理念在时序数据库领域展现出越来越强大的竞争力，得到了越来越多的用户认可。为了大家更好地了解MRS IoTDB，本文将会系统地为大家介绍MRS IoTDB的来龙去脉和功能特性，重点为大家介绍MRS IoTDB时序数据库的架构设计与实现，这次先为大家介绍MRS IoTDB的整体架构设计，后...

cloudsong
发表于2021-06-25 16:08:51
12155 0 0

12.1k 0 0

MRS IoTDB是华为FusionInsight MRS大数据套件最新推出的时序数据库产品，其领先的设计理念在时序数据库领域展现出越来越强大的竞争力，得到了越来越多的用户认可。为了大家更好地了解MRS IoTDB，本文将会系统地为大家介绍MRS IoTDB的来龙去脉和功能特性，重点为大家介绍MRS IoTDB时序数据库的架构设计与实现，这次先为大家介绍MRS IoTDB的整体架构设计，后...
MapReduce 数据库架构设计

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript