MapReduce_标签_开发者

博客(445)
视频(0)
论坛(0)
云声(0)
代码示例(0)

MRS HBase全局二级索引原理与使用场景
MRS HBase全局二级索引原理与使用场景

学习一下大数据
发表于2023-12-25 10:53:07
4594 0 2

4.5k 0 2

MRS HBase全局二级索引原理与使用场景
HBase MapReduce
MapReduce工作原理
MapReduce是Hadoop平台的基础组件之一，它是一个分布式的计算框架，用于大数据的离线计算，和HDFS、YARN搭配使用。MapReduce主要分为切片File、Map 、shuffle和Reduce四个阶段，数据导入——首先是将数据上传到HDFS上进行切片（一般默认分片是64M）、存储Map阶段——然后会由YARN进行资源的协调与分配，启动job，进行分片操作，一般默认HDFS的一...

huangruie
发表于2020-02-23 17:48:09
11566 0 1

11.5k 0 1

MapReduce是Hadoop平台的基础组件之一，它是一个分布式的计算框架，用于大数据的离线计算，和HDFS、YARN搭配使用。MapReduce主要分为切片File、Map 、shuffle和Reduce四个阶段，数据导入——首先是将数据上传到HDFS上进行切片（一般默认分片是64M）、存储Map阶段——然后会由YARN进行资源的协调与分配，启动job，进行分片操作，一般默认HDFS的一...
Hadoop MapReduce
MRS hive使用RDS的PGSQL
注意：此文档只适用于MRS2.X版本，非MRS2.0.0版本文档中对应的路径需要以实际路径为准1 创建RDS实例创建RDS实例时指定为Postgres数据库可以参考： https://static.huaweicloud.cn/upload/files/pdf/20171208/20171208101321_89598.pdf 注意：1）RDS实例的V...

lijian
发表于2019-07-16 09:17:38
10110 0 1

10.1k 0 1

注意：此文档只适用于MRS2.X版本，非MRS2.0.0版本文档中对应的路径需要以实际路径为准1 创建RDS实例创建RDS实例时指定为Postgres数据库可以参考： https://static.huaweicloud.cn/upload/files/pdf/20171208/20171208101321_89598.pdf 注意：1）RDS实例的V...
Hive MapReduce
Hadoop的理解
什么是Hadoop？Hadoop是一个开源的框架，可编写和运行分布式应用处理大规模数据，是专为离线和大规模数据分析而设计的，Hadoop=HDFS（文件系统，数据存储技术相关）+ Mapreduce（数据处理），Hadoop的数据来源可以是任何形式，在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能，具有更灵活的处理能力，不管任何数据形式最终会转化为key/value，key/va...

红云v587
发表于2019-06-26 21:06:36
11846 0 0

11.8k 0 0

什么是Hadoop？Hadoop是一个开源的框架，可编写和运行分布式应用处理大规模数据，是专为离线和大规模数据分析而设计的，Hadoop=HDFS（文件系统，数据存储技术相关）+ Mapreduce（数据处理），Hadoop的数据来源可以是任何形式，在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能，具有更灵活的处理能力，不管任何数据形式最终会转化为key/value，key/va...
Hadoop MapReduce
MapReduce工作流多种实现方式
学习hadoop，必不可少的就是编写 MapReduce 程序。当然，对于简单的分析程序，我们只需一个MapReduce任务就能搞定，然而对于比较复杂的分析程序，我们可能需要多个Job或者多个Map或者Reduce进行分析计算。本次主要说明的是多个 Job 或者多个 MapReduce 的编程形式。

Smy1121
发表于2019-06-22 18:25:16
5522 0 1

5.5k 0 1

学习hadoop，必不可少的就是编写 MapReduce 程序。当然，对于简单的分析程序，我们只需一个MapReduce任务就能搞定，然而对于比较复杂的分析程序，我们可能需要多个Job或者多个Map或者Reduce进行分析计算。本次主要说明的是多个 Job 或者多个 MapReduce 的编程形式。
Hadoop 大数据 MapReduce
Hadoop 各种压缩的应用场景与使用
一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，我们就叫它是这些较大容量的（可能一个或一个以上的文件）的压缩文件。而压缩此文件的过程称为文件压缩。

Smy1121
发表于2019-06-20 17:33:49
5280 0 0

5.2k 0 0

一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，我们就叫它是这些较大容量的（可能一个或一个以上的文件）的压缩文件。而压缩此文件的过程称为文件压缩。
Hadoop MapReduce
明星搜索指数统计
通过项目强化掌握 Combiner 和 Partitioner 优化 Hadoop 性能

Smy1121
发表于2019-06-20 17:23:16
4496 0 0

4.4k 0 0

通过项目强化掌握 Combiner 和 Partitioner 优化 Hadoop 性能
Hadoop MapReduce
MapReduce编程之Join多种应用场景与使用
Join操作概述在关系型数据库中 Join 是非常常见的操作，各种优化手段已经到了极致。在海量数据的环境下，不可避免的也会碰到这种类型的需求，例如在数据分析时需要连接从不同的数据源中获取到数据。不同于传统的单机模式，在分布式存储下采用 MapReduce 编程模型，也有相应的处理措施和优化方法。我们先简要地描述待解决的问题。假设有两个数据集：气象站数据库和天气记录数据库，并考虑如何合二为一...

Smy1121
发表于2019-06-20 16:32:13
6585 0 0

6.5k 0 0

Join操作概述在关系型数据库中 Join 是非常常见的操作，各种优化手段已经到了极致。在海量数据的环境下，不可避免的也会碰到这种类型的需求，例如在数据分析时需要连接从不同的数据源中获取到数据。不同于传统的单机模式，在分布式存储下采用 MapReduce 编程模型，也有相应的处理措施和优化方法。我们先简要地描述待解决的问题。假设有两个数据集：气象站数据库和天气记录数据库，并考虑如何合二为一...
分布式 Apache 缓存 MapReduce
MapReduce 二次排序
默认情况下，Map 输出的结果会对 Key 进行默认的排序，但是有时候需要对 Key 排序的同时再对 Value 进行排序，这时候就要用到二次排序了。下面让我们来介绍一下什么是二次排序。

Smy1121
发表于2019-06-20 15:22:51
4490 0 0

4.4k 0 0

默认情况下，Map 输出的结果会对 Key 进行默认的排序，但是有时候需要对 Key 排序的同时再对 Value 进行排序，这时候就要用到二次排序了。下面让我们来介绍一下什么是二次排序。
MapReduce
MapReduce数据倾斜与优化
MapReduce 优化 Combiner和Partitioner是用来优化MapReduce的，可以提高MapReduce的运行效率。下面我们来具体学习这两个组件。Combiner 我们以WordCount为例，首先通过下面的示意图直观的了解一下Combiner的位置和作用。从上图可以看出，Combiner介于 Mapper和Reducer...

Smy1121
发表于2019-06-20 15:09:53
5265 0 0

5.2k 0 0

MapReduce 优化 Combiner和Partitioner是用来优化MapReduce的，可以提高MapReduce的运行效率。下面我们来具体学习这两个组件。Combiner 我们以WordCount为例，首先通过下面的示意图直观的了解一下Combiner的位置和作用。从上图可以看出，Combiner介于 Mapper和Reducer...
网络 MapReduce
MapReduce多种输入格式
文件是 MapReduce 任务数据的初始存储地。正常情况下，输入文件一般是存储在 HDFS 里面。

Smy1121
发表于2019-06-20 14:47:22
6163 0 0

6.1k 0 0

文件是 MapReduce 任务数据的初始存储地。正常情况下，输入文件一般是存储在 HDFS 里面。
Hadoop MapReduce
深入剖析MapReduce架构及原理
MapReduce应用场景MapReduce 定义Hadoop 中的 MapReduce 是一个使用简单的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错式并行处理TB级别的数据集。MapReduce 来源Hadoop MapReduce 源于 Google 在2004年12月份发表的 MapReduce 论文。 Hadoop MapReduce ...

Smy1121
发表于2019-06-20 14:39:29
8159 0 0

8.1k 0 0

MapReduce应用场景MapReduce 定义Hadoop 中的 MapReduce 是一个使用简单的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错式并行处理TB级别的数据集。MapReduce 来源Hadoop MapReduce 源于 Google 在2004年12月份发表的 MapReduce 论文。 Hadoop MapReduce ...
Hadoop MapReduce
MR单元测试以及DeBug调试
Hadoop的MapReduce程序提交到集群环境中运行，出问题时定位非常麻烦，有时需要一遍遍修改代码和打印日志来排查问题，哪怕是比较小的问题。如果数据量很大的话调试起来就相当耗费时间。

Smy1121
发表于2019-06-20 13:37:44
4824 0 0

4.8k 0 0

Hadoop的MapReduce程序提交到集群环境中运行，出问题时定位非常麻烦，有时需要一遍遍修改代码和打印日志来排查问题，哪怕是比较小的问题。如果数据量很大的话调试起来就相当耗费时间。
Hadoop 单元测试 MapReduce
剖析平均气温项目，掌握MapReduce编程
MapReduce 是一种可用于数据处理的编程模型。该模型比较简单，但要想写出有用的程序却不太容易。

Smy1121
发表于2019-06-20 13:21:44
6315 0 0

6.3k 0 0

MapReduce 是一种可用于数据处理的编程模型。该模型比较简单，但要想写出有用的程序却不太容易。
Hadoop MapReduce
Python知识点：lambda, map, filter
通过示例介绍Python中的lambda，map，filter 函数的使用方法。

红皮橘子
发表于2019-02-20 16:38:10
4231 0 0

4.2k 0 0

通过示例介绍Python中的lambda，map，filter 函数的使用方法。
MapReduce python

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript