Hadoop_标签_开发者_华为云

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

Spark 概述
Apache Spark™ is a fast and general engine for large-scale data processing.

Smy1121
发表于2019-06-21 19:53:11
4494 0 0

4.4k 0 0

Apache Spark™ is a fast and general engine for large-scale data processing.
spark Hadoop 大数据
Kafka详解
Kafka是由LinkedIn开发的一个分布式的消息系统，使用Scala编写，它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。

Smy1121
发表于2019-06-21 19:23:23
7387 0 0

7.3k 0 0

Kafka是由LinkedIn开发的一个分布式的消息系统，使用Scala编写，它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。
分布式云存储 Hadoop Kafka
Flume 环境安装部署
Flume NG部署

Smy1121
发表于2019-06-21 15:24:26
4333 0 0

4.3k 0 0

Flume NG部署
Hadoop
Sqoop Export HDFS
Sqoop Export 应用场景

Smy1121
发表于2019-06-21 15:00:57
6088 0 0

6.0k 0 0

Sqoop Export 应用场景
Hadoop
Sqoop Import HDFS
Sqoop Import HDFS

Smy1121
发表于2019-06-21 14:57:40
4391 0 0

4.3k 0 0

Sqoop Import HDFS
Hadoop
SQOOP
什么是Sqoop

Smy1121
发表于2019-06-21 14:47:18
4482 0 0

4.4k 0 0

什么是Sqoop
Hadoop SQL
Hive 基本语法
Hive 和 Mysql 的表操作语句类似，如果熟悉 Mysql，学习Hive 的表操作就非常容易了，下面对Hive的表操作进行深入讲解。

Smy1121
发表于2019-06-21 12:02:37
6299 0 0

6.2k 0 0

Hive 和 Mysql 的表操作语句类似，如果熟悉 Mysql，学习Hive 的表操作就非常容易了，下面对Hive的表操作进行深入讲解。
Hadoop Hive
Hive环境的安装部署
Hive在客户端上的安装部署

Smy1121
发表于2019-06-20 21:12:10
5232 0 3

5.2k 0 3

Hive在客户端上的安装部署
MySQL Hadoop Hive
Hadoop分布式集群搭建-5节点（HA 高可用）
本次使用hadoop2.6.0版本配置Hadoop集群，同时配置NameNode+HA、ResourceManager+HA，并使用zookeeper来管理Hadoop集群。

Smy1121
发表于2019-06-20 20:16:37
7408 0 0

7.4k 0 0

本次使用hadoop2.6.0版本配置Hadoop集群，同时配置NameNode+HA、ResourceManager+HA，并使用zookeeper来管理Hadoop集群。
分布式 Hadoop
ZooKeeper 配置管理Hadoop集群
ZooKeeper 提供了一系列 API编程接口，这些API接口非常简单，就像一个可提供强一致性保证的分布式小文件系统。

Smy1121
发表于2019-06-20 18:12:50
4928 0 1

4.9k 0 1

ZooKeeper 提供了一系列 API编程接口，这些API接口非常简单，就像一个可提供强一致性保证的分布式小文件系统。
ZooKeeper Hadoop
Yarn的架构及原理
YARN 产生背景MapReduce存在的问题：1）JobTracker 单点故障。2）JobTracker 承受的访问压力大，影响系统的扩展性。3）不支持MapReduce之外的计算框架，比如Storm、Spark、Flink什么是YARNYARN 是Hadoop2.0版本新引入的资源管理系统，直接从MR1演化而来。核心思想：将MR1中JobTracker的资源管理和作业调度两个功能分开...

Smy1121
发表于2019-06-20 17:44:11
7204 0 0

7.2k 0 0

YARN 产生背景MapReduce存在的问题：1）JobTracker 单点故障。2）JobTracker 承受的访问压力大，影响系统的扩展性。3）不支持MapReduce之外的计算框架，比如Storm、Spark、Flink什么是YARNYARN 是Hadoop2.0版本新引入的资源管理系统，直接从MR1演化而来。核心思想：将MR1中JobTracker的资源管理和作业调度两个功能分开...
Hadoop Yarn
Hadoop 各种压缩的应用场景与使用
一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，我们就叫它是这些较大容量的（可能一个或一个以上的文件）的压缩文件。而压缩此文件的过程称为文件压缩。

Smy1121
发表于2019-06-20 17:33:49
5341 0 0

5.3k 0 0

一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，我们就叫它是这些较大容量的（可能一个或一个以上的文件）的压缩文件。而压缩此文件的过程称为文件压缩。
Hadoop MapReduce
明星搜索指数统计
通过项目强化掌握 Combiner 和 Partitioner 优化 Hadoop 性能

Smy1121
发表于2019-06-20 17:23:16
4556 0 0

4.5k 0 0

通过项目强化掌握 Combiner 和 Partitioner 优化 Hadoop 性能
Hadoop MapReduce
MapReduce多种输入格式
文件是 MapReduce 任务数据的初始存储地。正常情况下，输入文件一般是存储在 HDFS 里面。

Smy1121
发表于2019-06-20 14:47:22
6228 0 0

6.2k 0 0

文件是 MapReduce 任务数据的初始存储地。正常情况下，输入文件一般是存储在 HDFS 里面。
Hadoop MapReduce
深入剖析MapReduce架构及原理
MapReduce应用场景MapReduce 定义Hadoop 中的 MapReduce 是一个使用简单的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错式并行处理TB级别的数据集。MapReduce 来源Hadoop MapReduce 源于 Google 在2004年12月份发表的 MapReduce 论文。 Hadoop MapReduce ...

Smy1121
发表于2019-06-20 14:39:29
8249 0 0

8.2k 0 0

MapReduce应用场景MapReduce 定义Hadoop 中的 MapReduce 是一个使用简单的软件框架，基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上，并以一种可靠容错式并行处理TB级别的数据集。MapReduce 来源Hadoop MapReduce 源于 Google 在2004年12月份发表的 MapReduce 论文。 Hadoop MapReduce ...
Hadoop MapReduce

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript