MapReduce_标签_开发者

博客(445)
视频(0)
论坛(0)
云声(0)
代码示例(0)

FusionInsight MRS组件FTP-Server基本原理
FTP-Server简介FusionInsight MRS的FTP-Server服务是一个纯Java的、基于现有开放的FTP协议的FTP服务。FTP-Server支持FTP、FTPS协议，每个服务都支持PORT、PASSIVE数据通信协议。用户或业务组件可通过通用的FTP客户端、FTP协议对HDFS文件系统进行基本的操作，如：文件上传，文件下载，目录查看，目录创建，目录删除，文件权限修改等...

一枚核桃
发表于2021-05-25 16:10:35
6917 0 0

6.9k 0 0

FTP-Server简介FusionInsight MRS的FTP-Server服务是一个纯Java的、基于现有开放的FTP协议的FTP服务。FTP-Server支持FTP、FTPS协议，每个服务都支持PORT、PASSIVE数据通信协议。用户或业务组件可通过通用的FTP客户端、FTP协议对HDFS文件系统进行基本的操作，如：文件上传，文件下载，目录查看，目录创建，目录删除，文件权限修改等...
EI企业智能 FTP FusionInsight MapReduce
集成Ranger后，MRS的Hive组件使用set role admin的方法
背景FusionInsight MRS集群默认安装Ranger服务并启用了Ranger鉴权模型，管理员可以通过组件权限插件对组件资源的访问设置细粒度的安全访问策略。目前安全模式集群中支持Ranger的组件包括：HDFS、Yarn、HBase、Hive、Spark2x、Kafka、Storm、Elasticsearch、HetuEngine。使用场景MRS3.0.2以前的版本中只需要在Fu...

一枚核桃
发表于2021-04-26 11:51:01
8436 0 0

8.4k 0 0

背景FusionInsight MRS集群默认安装Ranger服务并启用了Ranger鉴权模型，管理员可以通过组件权限插件对组件资源的访问设置细粒度的安全访问策略。目前安全模式集群中支持Ranger的组件包括：HDFS、Yarn、HBase、Hive、Spark2x、Kafka、Storm、Elasticsearch、HetuEngine。使用场景MRS3.0.2以前的版本中只需要在Fu...
EI企业智能 FusionInsight Hive MapReduce
Spark 学习中的一些疑问
Spark 学习中的一些疑问问题1：Spark 为什么只有在调用 action 时才会触发任务执行呢？问题2：Spark 与 MapReduce 对比

cloud昵称bbs
发表于2021-04-03 15:08:05
5804 0 0

5.8k 0 0

Spark 学习中的一些疑问问题1：Spark 为什么只有在调用 action 时才会触发任务执行呢？问题2：Spark 与 MapReduce 对比
MapReduce spark
使用Kettle 8.3对接开启Kerberos认证的MRS集群的HDFS组件
开源Kettle版本不支持Kerberos认证的Hadoop集群，本文通过简单的插件改造，使得Kettle 8.3能够连接开启Kerberos认证的MRS集群的HDFS组件

一枚核桃
发表于2021-04-02 17:18:28
8436 0 0

8.4k 0 0

开源Kettle版本不支持Kerberos认证的Hadoop集群，本文通过简单的插件改造，使得Kettle 8.3能够连接开启Kerberos认证的MRS集群的HDFS组件
FusionInsight MapReduce 大数据
MRS配置yarn用户隔离
使用yarn运行任务，有时候需要配置不同用户之间的权限隔离。本文档主要指导如何配置MRS集群不同用户之间的yarn任务隔离。

泽及天下不为仁
发表于2021-03-29 14:41:36
11233 0 0

11.2k 0 0

使用yarn运行任务，有时候需要配置不同用户之间的权限隔离。本文档主要指导如何配置MRS集群不同用户之间的yarn任务隔离。
EI企业智能 MapReduce MapReduce服务 MRS Yarn
“七大属性加持，三个全新升级组件”这个高性能利器有点厉害
高性能利器！华为云MRS ClickHouse重磅推出！

技术火炬手
发表于2021-03-11 11:09:27
8910 0 0

8.9k 0 0

高性能利器！华为云MRS ClickHouse重磅推出！
人工智能 AI开发平台ModelArts ClickHouse MapReduce 智能数据
MRS集群pyspark使用obsclient报错缺少obs模块
MRS集群pyspark使用obsclient报错缺少obs模块,报错如下图1：解决方案一：前期准备1. MRS2.1.0、Spark2.3.22. 样例代码在提交任务的节点（比如master1）,代码路径为/tmp/yy/fly.py代码如下:import addfrom obs import * from pyspark import SparkContext from pyspark ...

讲道理不讲感情
发表于2021-02-25 10:35:55
10757 0 0

10.7k 0 0

MRS集群pyspark使用obsclient报错缺少obs模块,报错如下图1：解决方案一：前期准备1. MRS2.1.0、Spark2.3.22. 样例代码在提交任务的节点（比如master1）,代码路径为/tmp/yy/fly.py代码如下:import addfrom obs import * from pyspark import SparkContext from pyspark ...
MapReduce Python spark 对象存储服务 OBS
MRS 3.X集群Spark on CloudTable使用指导
1. 参考官方文档-使用2.x及之前的开发指南（https://support.huaweicloud.cn/devg-mrs/mrs_06_0187.html），开发指南(适用于2.x及之前)->Spark应用开发章节->Spark on HBase，将样例代码的pom文件hbase.version 配置成<hbase.version>1.3.1-mrs-1.9.0</hbase.ver...

讲道理不讲感情
发表于2021-02-03 17:29:43
7481 0 1

7.4k 0 1

1. 参考官方文档-使用2.x及之前的开发指南（https://support.huaweicloud.cn/devg-mrs/mrs_06_0187.html），开发指南(适用于2.x及之前)->Spark应用开发章节->Spark on HBase，将样例代码的pom文件hbase.version 配置成<hbase.version>1.3.1-mrs-1.9.0</hbase.ver...
MapReduce spark 表格存储服务 CloudTable
CDH Kafka集群和Mrs kafka集群对接同样的业务，但是MRS集群磁盘上存储的文件大小比CDH的大量许多
集群后续需要搬迁，割接期同一个业务对接两套集群，发现旧的CDH Kafka集群和新的Mrs kafka集群节点上存储的文件大小相差了几十倍。问题处理过程：一、创建新的消费组分别从头部和尾部进行消费，并查询offset，计算当前存储的消息总数量，对比是否数据量差异导致1.执行如下语句创建新的consumerGroup，并消费数据【这里不能使用现网使用的consumerGroup】kafka-v...

adadad
发表于2021-01-30 17:02:03
9844 1 2

9.8k 1 2

集群后续需要搬迁，割接期同一个业务对接两套集群，发现旧的CDH Kafka集群和新的Mrs kafka集群节点上存储的文件大小相差了几十倍。问题处理过程：一、创建新的消费组分别从头部和尾部进行消费，并查询offset，计算当前存储的消息总数量，对比是否数据量差异导致1.执行如下语句创建新的consumerGroup，并消费数据【这里不能使用现网使用的consumerGroup】kafka-v...
Kafka MapReduce
GaussDB(DWS) 数据融合系列第三期：MRS数据导入DWS
MRS导入数据概述MapReduce服务（MapReduce Service，简称MRS）是一个基于开源Hadoop生态环境而运行的大数据集群，对外提供大容量数据的存储和分析能力，可解决用户的数据存储和处理需求。用户可以将海量业务数据，存储在MRS的分析集群，即使用Hive/Spark组件保存。Hive/Spark的数据文件则保存在HDFS中。GaussDB(DWS)支持在相同网络中，配置一...

西游故事多
发表于2021-01-30 11:16:08
12351 0 0

12.3k 0 0

MRS导入数据概述MapReduce服务（MapReduce Service，简称MRS）是一个基于开源Hadoop生态环境而运行的大数据集群，对外提供大容量数据的存储和分析能力，可解决用户的数据存储和处理需求。用户可以将海量业务数据，存储在MRS的分析集群，即使用Hive/Spark组件保存。Hive/Spark的数据文件则保存在HDFS中。GaussDB(DWS)支持在相同网络中，配置一...
MapReduce 云数据仓库 GaussDB(DWS) 数据库
MRS集群支持跨子网扩容
背景：MRS集群创建时指定VPC及下属子网，而且后期无法修改。其中子网可用IP数受限于网段与掩码，实际可用IP数用户在创建子网/子网详情可以查看：如果业务规模发生大规模增长，出现子网IP不够的情况导致MRS集群将无法扩容，对业务产生极大限制。解决方案默认情况下，同一个VPC的所有子网内的弹性云服务器均可以进行通信，不同VPC的弹性云服务器不能进行通信。用户也可以通过网络ACL设置来改变...

啊喔YeYe
发表于2021-01-30 10:26:37
12315 1 2

12.3k 1 2

背景：MRS集群创建时指定VPC及下属子网，而且后期无法修改。其中子网可用IP数受限于网段与掩码，实际可用IP数用户在创建子网/子网详情可以查看：如果业务规模发生大规模增长，出现子网IP不够的情况导致MRS集群将无法扩容，对业务产生极大限制。解决方案默认情况下，同一个VPC的所有子网内的弹性云服务器均可以进行通信，不同VPC的弹性云服务器不能进行通信。用户也可以通过网络ACL设置来改变...
MapReduce 虚拟私有云 VPC
华为云FusionInsight MRS赋能新云原生企业，加速政企数字化转型
华为云FusionInsight MRS云原生数据湖为政企客户海量数据提供大数据解决方案，支持大数据实时分析、离线分析、交互查询、实时检索等应用场景，助力政企释放海量数据价值，实现一企一湖、一城一湖，业务洞见更准，价值兑现更快！

沙漏
发表于2020-12-30 20:58:49
5876 0 0

5.8k 0 0

华为云FusionInsight MRS云原生数据湖为政企客户海量数据提供大数据解决方案，支持大数据实时分析、离线分析、交互查询、实时检索等应用场景，助力政企释放海量数据价值，实现一企一湖、一城一湖，业务洞见更准，价值兑现更快！
EI企业智能 MapReduce 大数据 FusionInsight
数据集成之sqoop介绍
用户需要将分散在各个系统的数据统一处理，将源中的数据统一传输到大数据平台。需要将不同的数据汇聚、清洗、转换。此时就需要一款支持hadoop和与关系型数据库之间的数据的导入导出工具，即数据迁移工具。此时sqoop(sql to hadoop)就诞生了,sqoop是一个在结构化数据、半结构化数据、和非结构非数据的高效的数据转换工具，其构建起传统db和hadoop之间的桥梁。主要用于批量数据处理。

米兰的小铁匠
发表于2020-11-24 12:49:32
9027 0 0

9.0k 0 0

用户需要将分散在各个系统的数据统一处理，将源中的数据统一传输到大数据平台。需要将不同的数据汇聚、清洗、转换。此时就需要一款支持hadoop和与关系型数据库之间的数据的导入导出工具，即数据迁移工具。此时sqoop(sql to hadoop)就诞生了,sqoop是一个在结构化数据、半结构化数据、和非结构非数据的高效的数据转换工具，其构建起传统db和hadoop之间的桥梁。主要用于批量数据处理。
分布式 MapReduce
高性能利器！华为云MRS ClickHouse重磅推出！
前言高性能引擎简介ClickHouse是最近这两年非常火的一款开源的分析型数据库，来自俄罗斯的Yandex公司，2016年开源。它独立于Hadoop大数据体系，其最核心的特点是极致压缩率和极速查询性能，能为用户节约大量成本，同时创造更多收益。它提供了兼容标准SQL协议的接口，支持JDBC、ODBC驱动，使用C++语言实现。当然它还有个宏伟的目标：成为世界上最快的分析型数据库，官方测试数据表明...

he lifu
发表于2020-11-16 20:26:21
30595 2 1

30.5k 2 1

前言高性能引擎简介ClickHouse是最近这两年非常火的一款开源的分析型数据库，来自俄罗斯的Yandex公司，2016年开源。它独立于Hadoop大数据体系，其最核心的特点是极致压缩率和极速查询性能，能为用户节约大量成本，同时创造更多收益。它提供了兼容标准SQL协议的接口，支持JDBC、ODBC驱动，使用C++语言实现。当然它还有个宏伟的目标：成为世界上最快的分析型数据库，官方测试数据表明...
MapReduce服务 MRS 大数据 EI企业智能 ClickHouse MapReduce
MRS集群创建过程中遇到的问题
MRS集群创建过程中遇到的问题华为Stack创建MRS集群时需要注意MRS节点规格关联的主机组中，主机个数应该大于集群master节点数，以满足反亲和性要求。MRS集群 FusionInsight Manger admin账户应注意避免与系统默认账户重复，否则可能导致创建失败。集群创建之前确认vpc类型的外部网络已经分配。集群创建过程较长，在环境资源紧张、或者测试时建议先临时关闭MRS回滚功...

黄大猩
发表于2020-11-04 09:42:59
10836 0 0

10.8k 0 0

MRS集群创建过程中遇到的问题华为Stack创建MRS集群时需要注意MRS节点规格关联的主机组中，主机个数应该大于集群master节点数，以满足反亲和性要求。MRS集群 FusionInsight Manger admin账户应注意避免与系统默认账户重复，否则可能导致创建失败。集群创建之前确认vpc类型的外部网络已经分配。集群创建过程较长，在环境资源紧张、或者测试时建议先临时关闭MRS回滚功...
MapReduce

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript