Hadoop_标签_开发者_华为云

博客(757)
视频(1)
论坛(0)
云声(0)
代码示例(0)

Ambari集群部署
Apache Ambari是一个基于Web的支持Apache Hadoop集群的供应、管理和监控的开源工具，Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。提供Web UI进行可视化的集群管理，简化了大数据平台的安装、使用难度。服务器资源目录ip地址节点组件192.168.186....

李子捌
发表于2021-11-24 20:07:23
5920 1 1

5.9k 1 1

Apache Ambari是一个基于Web的支持Apache Hadoop集群的供应、管理和监控的开源工具，Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。提供Web UI进行可视化的集群管理，简化了大数据平台的安装、使用难度。服务器资源目录ip地址节点组件192.168.186....
Hadoop Linux 大数据
萌新带你入门大数据之Hadoop源码编译
一、前期准备工作1、准备一台CentOS虚拟机，虚拟机需要能够联网，采用root角色编译2、准备以下安装包（hadoop源码、JDK8、maven、ant、protobuf），分别从各自的官网下载即可hadoop-2.10.1-src.tar.gzjdk-8u281-linux-x64.tar.gzapache-ant-1.10.9-bin.tar.gzapache-maven-3.6.3...

lwq1228
发表于2021-11-17 21:51:06
11068 0 0

11.0k 0 0

一、前期准备工作1、准备一台CentOS虚拟机，虚拟机需要能够联网，采用root角色编译2、准备以下安装包（hadoop源码、JDK8、maven、ant、protobuf），分别从各自的官网下载即可hadoop-2.10.1-src.tar.gzjdk-8u281-linux-x64.tar.gzapache-ant-1.10.9-bin.tar.gzapache-maven-3.6.3...
Hadoop 大数据
萌新带你入门大数据之Hadoop简介
一、什么是Hadoop 1、Hadoop是什么（1）Hadoop是一个由Apache基金会所开发的分布式系统基础架构（2）主要解决海量数据的存储和海量数据的分析计算问题（3）广义上来说，Hadoop通常是指一个更广泛的概念–Hadoop生态圈 2、Hadoop发展历史：（1）Lucene框架是Doug Cutting开创的开源软件，用Jav a书写代码，实现与Google类似的全文搜索功能...

lwq1228
发表于2021-11-17 21:42:57
10549 0 0

10.5k 0 0

一、什么是Hadoop 1、Hadoop是什么（1）Hadoop是一个由Apache基金会所开发的分布式系统基础架构（2）主要解决海量数据的存储和海量数据的分析计算问题（3）广义上来说，Hadoop通常是指一个更广泛的概念–Hadoop生态圈 2、Hadoop发展历史：（1）Lucene框架是Doug Cutting开创的开源软件，用Jav a书写代码，实现与Google类似的全文搜索功能...
Hadoop 大数据
FusionInsight MRS HDFS组件数据存储策略配置指导
操作场景默认情况下，HDFS NameNode自动选择DataNode保存数据的副本。在实际业务中，可能存在以下场景：DataNode上可能存在不同的存储设备，数据需要选择一个合适的存储设备分级存储数据。DataNode不同目录中的数据重要程度不同，数据需要根据目录标签选择一个合适的DataNode节点保存。DataNode集群使用了异构服务器，关键数据需要保存在具有高度可靠性的机架组中。对...

一枚核桃
发表于2021-10-29 11:04:35
8793 0 0

8.7k 0 0

操作场景默认情况下，HDFS NameNode自动选择DataNode保存数据的副本。在实际业务中，可能存在以下场景：DataNode上可能存在不同的存储设备，数据需要选择一个合适的存储设备分级存储数据。DataNode不同目录中的数据重要程度不同，数据需要根据目录标签选择一个合适的DataNode节点保存。DataNode集群使用了异构服务器，关键数据需要保存在具有高度可靠性的机架组中。对...
EI企业智能 FusionInsight Hadoop MapReduce
华为云MRS Spark基于华为云对象存储服务(OBS)的Hadoop文件系统快速删除指南
• 配置快速删除在Spark客户端的core-site.xml 配置文件中/opt/Bigdata/client/Spark2x/spark/conf/core-site.xml添加下列属性：fs.obs.trash.enable为true；fs.obs.trash.dir 为”.obs-Posix-FastDelete/”。注：此目录可根据客户需求，命名。例如：<property> ...

yugogo
发表于2021-10-23 00:28:33
9634 0 0

9.6k 0 0

• 配置快速删除在Spark客户端的core-site.xml 配置文件中/opt/Bigdata/client/Spark2x/spark/conf/core-site.xml添加下列属性：fs.obs.trash.enable为true；fs.obs.trash.dir 为”.obs-Posix-FastDelete/”。注：此目录可根据客户需求，命名。例如：<property> ...
Hadoop 对象存储服务 OBS
Hadoop 概述
Hadoop 概述

兮动人
发表于2021-10-08 10:59:16
3322 0 0

3.3k 0 0

Hadoop 概述
Apache Hadoop
HDFS Java 客户端 API
HDFS Java 客户端 API

兮动人
发表于2021-09-28 09:11:34
2956 0 0

2.9k 0 0

HDFS Java 客户端 API
API Hadoop Java
Linux系列：用户和用户组、为用户配置sudoer权限！
linux系列第六课

数据分析与统计学之美
发表于2021-09-27 20:53:34
3465 0 0

3.4k 0 0

linux系列第六课
Hadoop Linux
HDFS Shell 命令实操
HDFS Shell 命令实操

兮动人
发表于2021-09-27 10:12:58
3642 0 0

3.6k 0 0

HDFS Shell 命令实操
Hadoop Shell
HDFS Shell 命令简介及查询
HDFS Shell 命令简介及查询

兮动人
发表于2021-09-26 16:56:27
2884 0 0

2.8k 0 0

HDFS Shell 命令简介及查询
Hadoop Shell
Hive虚拟列的生成与计算【1】
本文主要解析介绍Hive虚拟列相关源码

想要一只猫
发表于2021-09-02 00:38:57
10283 0 0

10.2k 0 0

本文主要解析介绍Hive虚拟列相关源码
EI企业智能 Hadoop Hive 智能数据表格存储服务 CloudTable
FusionInshgt MRS启用集群间拷贝功能
当用户需要将保存在HDFS中的数据从当前集群备份到另外一个集群时，需要使用DistCp工具。DistCp工具依赖于集群间拷贝功能，该功能默认未启用。拷贝数据的集群双方都需要配置。管理员可以根据以下指导，在FusionInsight Manager修改参数以启用集群间拷贝功能

一枚核桃
发表于2021-08-28 14:29:19
3669 0 0

3.6k 0 0

当用户需要将保存在HDFS中的数据从当前集群备份到另外一个集群时，需要使用DistCp工具。DistCp工具依赖于集群间拷贝功能，该功能默认未启用。拷贝数据的集群双方都需要配置。管理员可以根据以下指导，在FusionInsight Manager修改参数以启用集群间拷贝功能
EI企业智能 FusionInsight Hadoop MapReduce
Apache Sqoop 教程 - 在 HDFS 和 RDBMS 之间导入/导出数据
需要一种可以从关系数据库导入和导出数据的工具。这就是 Apache Sqoop 诞生的原因。Sqoop 可以轻松地与 Hadoop 集成并从 HDFS 上的关系数据库转储结构化数据，从而补充 Hadoop 的强大功能。

Donglian Lin
发表于2021-08-16 09:17:11
5182 0 0

5.1k 0 0

需要一种可以从关系数据库导入和导出数据的工具。这就是 Apache Sqoop 诞生的原因。Sqoop 可以轻松地与 Hadoop 集成并从 HDFS 上的关系数据库转储结构化数据，从而补充 Hadoop 的强大功能。
Apache Hadoop
Apache Hadoop HDFS 架构
在服务客户端的读请求时，HDFS 选择离客户端最近的副本。这减少了读取延迟和带宽消耗。因此，如果可能，选择与读取器节点位于同一机架上的副本。

Donglian Lin
发表于2021-08-10 08:37:58
4207 0 0

4.2k 0 0

在服务客户端的读请求时，HDFS 选择离客户端最近的副本。这减少了读取延迟和带宽消耗。因此，如果可能，选择与读取器节点位于同一机架上的副本。
Apache Hadoop
面试题：MapReduce黑名单过滤问题
题目：MapReduce 黑名单过滤问题问题描述：在HDFS中有两个名单：人员名单，人员黑名单。要求：对该人员名单进行过滤，除去黑名单中的人员，并且统计人员名单中人员出现的频次。将结果生成文件，保存在HDFS中。

RupertTears
发表于2021-07-29 13:58:20
3851 0 0

3.8k 0 0

题目：MapReduce 黑名单过滤问题问题描述：在HDFS中有两个名单：人员名单，人员黑名单。要求：对该人员名单进行过滤，除去黑名单中的人员，并且统计人员名单中人员出现的频次。将结果生成文件，保存在HDFS中。
Hadoop MapReduce

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript