Hadoop_标签_开发者_华为云

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

大数据NiFi（十八）：离线同步MySQL数据到HDFS
离线同步MySQL数据到HDFS案例：使用NiFi将MySQL中数据导入到HDFS中。以上案例用到的处理器有“QueryDatabaseTable”、“ConvertAvroToJSON”、“SplitJson”、“PutHDFS”四个处理器。一、配置“QueryDatabaseTable”处理器该处理器主要使用提供的SQL语句或者生成SQL语句来查询MySQL中的数据，查询结果转换成Avr...

Lansonli
发表于2023-02-21 16:11:48
3193 0 0

3.1k 0 0

离线同步MySQL数据到HDFS案例：使用NiFi将MySQL中数据导入到HDFS中。以上案例用到的处理器有“QueryDatabaseTable”、“ConvertAvroToJSON”、“SplitJson”、“PutHDFS”四个处理器。一、配置“QueryDatabaseTable”处理器该处理器主要使用提供的SQL语句或者生成SQL语句来查询MySQL中的数据，查询结果转换成Avr...
Hadoop MySQL 大数据
Hive命令使用记录
Hive命令使用记录

WHYBIGDATA
发表于2023-01-19 17:10:52
2352 0 0

2.3k 0 0

Hive命令使用记录
Hadoop Hive 大数据
关于Hadoop集群物理及虚拟内存的检测的设置说明
关于Hadoop集群物理及虚拟内存的检测的设置说明

WHYBIGDATA
发表于2023-01-18 13:55:23
2310 0 0

2.3k 0 0

关于Hadoop集群物理及虚拟内存的检测的设置说明
Hadoop 虚拟化
Hive on Tez 的安装配置
Hive on Tez 的安装配置

WHYBIGDATA
发表于2023-01-16 10:43:03
2747 0 0

2.7k 0 0

Hive on Tez 的安装配置
Hadoop Hive 大数据
MapReduce报错：「MKDirs failed to create file」
MapReduce报错：「MKDirs failed to create file」

WHYBIGDATA
发表于2023-01-15 11:15:15
2440 0 0

2.4k 0 0

MapReduce报错：「MKDirs failed to create file」
Hadoop MapReduce 大数据
MapReduce关于类型转换报错记录
MapReduce关于类型转换报错记录

WHYBIGDATA
发表于2023-01-13 12:47:41
2261 0 0

2.2k 0 0

MapReduce关于类型转换报错记录
Hadoop MapReduce 大数据
执行MapReduce报错：无法分配内存 (errno=12)
执行MapReduce报错：无法分配内存 (errno=12)

WHYBIGDATA
发表于2023-01-13 12:46:21
2289 0 0

2.2k 0 0

执行MapReduce报错：无法分配内存 (errno=12)
Hadoop MapReduce 大数据
CDH6.3.1-Hadoop3.0.0集群部署
基于CDH6.3.1版本-Hadoop3.0.0集群部署注意：虚拟服务器要固定ip地址一、修改主机名在对应服务器分别执行：hostnamectl set-hostname ****-master1hostnamectl set-hostname ****-master2hostnamectl set-hostname ****-master3hostnamectl set-hostname ...

Smy1121
发表于2022-12-30 15:07:15
4311 0 0

4.3k 0 0

基于CDH6.3.1版本-Hadoop3.0.0集群部署注意：虚拟服务器要固定ip地址一、修改主机名在对应服务器分别执行：hostnamectl set-hostname ****-master1hostnamectl set-hostname ****-master2hostnamectl set-hostname ****-master3hostnamectl set-hostname ...
Hadoop Hive MySQL ssh
Hadoop-Apache Hadoop大数据解决方案的整体介绍
一大数据价值和当前主要应用大数据的价值当前全球数据的生产速度急剧加快，海量数据的存储以及计算问题通过传统的解决方案已经无法应对处理，为此急需有一套针对性的解决方案，Hadoop应运而生。当前大数据的行业应用大数据解决方案就是通过挖掘海量数据的价值，分析数据之间的联系，并最终为企业生产、经营决策等赋能。电信运营商行业1）基于海量生产数据/日志数据，提供历史清单类数据快速查询服务2）汇聚各应...

TT-千叶
发表于2022-12-28 11:21:21
8705 0 0

8.7k 0 0

一大数据价值和当前主要应用大数据的价值当前全球数据的生产速度急剧加快，海量数据的存储以及计算问题通过传统的解决方案已经无法应对处理，为此急需有一套针对性的解决方案，Hadoop应运而生。当前大数据的行业应用大数据解决方案就是通过挖掘海量数据的价值，分析数据之间的联系，并最终为企业生产、经营决策等赋能。电信运营商行业1）基于海量生产数据/日志数据，提供历史清单类数据快速查询服务2）汇聚各应...
Apache Hadoop 大数据
win 10 + maven + idea 15 + Hadoop 2.7.3开发环境配置
前言今天想在win 10上搭一个Hadoop的开发环境，希望能够直联Hadoop集群并提交MapReduce任务，这里给出相关的关键配置。步骤关于maven以及idea的安装这里不再赘述，非常简单。在win 10上配置Hadoop将Hadoop 2.7.3直接解压到系统某个位置，以我的文件名称为例，解压到E:大数据平台hadoophadoop-2.7.3中配置HADOOP_HOME以及P...

TT-千叶
发表于2022-12-28 11:19:40
9088 0 0

9.0k 0 0

前言今天想在win 10上搭一个Hadoop的开发环境，希望能够直联Hadoop集群并提交MapReduce任务，这里给出相关的关键配置。步骤关于maven以及idea的安装这里不再赘述，非常简单。在win 10上配置Hadoop将Hadoop 2.7.3直接解压到系统某个位置，以我的文件名称为例，解压到E:大数据平台hadoophadoop-2.7.3中配置HADOOP_HOME以及P...
Hadoop IDE Maven
Hadoop-2.6.0-cdh5.7.0安装详解
下载Hadoop和JDK下载Hadoop地址：http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz下载jdk：注册甲骨文账号下载，推荐1.7版本安装JDK解压jdk压缩包tar -zxvf /home/hadoop/software/jdk-7u80-linux-x64.tar.gz -C /usr/jav...

TT-千叶
发表于2022-12-28 11:12:05
9116 0 0

9.1k 0 0

下载Hadoop和JDK下载Hadoop地址：http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz下载jdk：注册甲骨文账号下载，推荐1.7版本安装JDK解压jdk压缩包tar -zxvf /home/hadoop/software/jdk-7u80-linux-x64.tar.gz -C /usr/jav...
Hadoop JDK
大数据面试题（二）：Hadoop的联邦机制核心高频面试题
Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...

Lansonli
发表于2022-12-14 14:00:34
2310 0 0

2.3k 0 0

Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...
Hadoop 大数据
大数据面试题（二）：Hadoop的联邦机制核心高频面试题
Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...

Lansonli
发表于2022-12-12 21:41:18
2212 0 0

2.2k 0 0

Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...
Hadoop 大数据
CDH+Kylin三部曲之一：准备工作
本文是《CDH+Kylin三部曲》的第一篇，主要是为后面的安装和启动做好准备工作

程序员欣宸
发表于2022-12-05 08:18:46
2265 0 0

2.2k 0 0

本文是《CDH+Kylin三部曲》的第一篇，主要是为后面的安装和启动做好准备工作
Hadoop
超简单的CDH6部署和体验(单机版)
借助ansible，和已经调试好的playbook，快速部署和体验单机版CDH6

程序员欣宸
发表于2022-12-01 14:47:08
2605 0 0

2.6k 0 0

借助ansible，和已经调试好的playbook，快速部署和体验单机版CDH6
Hadoop spark

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript