Hadoop_标签_开发者_华为云

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

hadoop文件的序列化
一般来说，“活的”对象只生存在内存里，关机断电就没有了。而且“活的”对象只能由本地的进程使用，不能被发送到网络上的另外一台计算机。然而序列化可以存储“活的”对象，可以将“活的”对象发送到远程计算机。

Smy1121
发表于2019-06-20 14:26:02
4312 0 0

4.3k 0 0

一般来说，“活的”对象只生存在内存里，关机断电就没有了。而且“活的”对象只能由本地的进程使用，不能被发送到网络上的另外一台计算机。然而序列化可以存储“活的”对象，可以将“活的”对象发送到远程计算机。
Java Hadoop
使用文件模式，实现多文件上传至HDFS
前面有讲如何上传单个本地文件到HDFS文件系统，那么当一个目录下包含很多个文件，我们该如何做呢？这时我们就需要用到文件模式。所以，在项目开始之前，先来学习一下什么是文件模式？文件模式在某个单一操作中处理一系列文件是很常见的。例如一个日志处理的MapReduce作业可能要分析一个月的日志量。如果一个文件一个文件或者一个目录一个目录的声明那就太麻烦了，我们可以使...

Smy1121
发表于2019-06-20 14:22:52
5901 0 0

5.9k 0 0

前面有讲如何上传单个本地文件到HDFS文件系统，那么当一个目录下包含很多个文件，我们该如何做呢？这时我们就需要用到文件模式。所以，在项目开始之前，先来学习一下什么是文件模式？文件模式在某个单一操作中处理一系列文件是很常见的。例如一个日志处理的MapReduce作业可能要分析一个月的日志量。如果一个文件一个文件或者一个目录一个目录的声明那就太麻烦了，我们可以使...
Hadoop
掌握HDFS的Shell访问和Java API访问
HDFS设计的主要目的是对海量数据进行处理，也就是说在其上能够存储很大量文件（可以存储TB级的文件）。

Smy1121
发表于2019-06-20 13:58:52
5973 0 0

5.9k 0 0

HDFS设计的主要目的是对海量数据进行处理，也就是说在其上能够存储很大量文件（可以存储TB级的文件）。
Java Shell Hadoop
掌握HDFS2的新特性：HA和Federation
HDFS的HA机制

Smy1121
发表于2019-06-20 13:51:01
6453 0 0

6.4k 0 0

HDFS的HA机制
Hadoop 存储
深入剖析分布式文件系统HDFS
Hadoop主要由HDFS和MapReduce 两个核心部分组成。其中最底部就是HDFS，它被用来存储Hadoop 集群中所有存储节点上的文件。

Smy1121
发表于2019-06-20 13:46:59
4644 0 0

4.6k 0 0

Hadoop主要由HDFS和MapReduce 两个核心部分组成。其中最底部就是HDFS，它被用来存储Hadoop 集群中所有存储节点上的文件。
分布式 Hadoop
MR单元测试以及DeBug调试
Hadoop的MapReduce程序提交到集群环境中运行，出问题时定位非常麻烦，有时需要一遍遍修改代码和打印日志来排查问题，哪怕是比较小的问题。如果数据量很大的话调试起来就相当耗费时间。

Smy1121
发表于2019-06-20 13:37:44
4900 0 0

4.9k 0 0

Hadoop的MapReduce程序提交到集群环境中运行，出问题时定位非常麻烦，有时需要一遍遍修改代码和打印日志来排查问题，哪怕是比较小的问题。如果数据量很大的话调试起来就相当耗费时间。
Hadoop 单元测试 MapReduce
剖析平均气温项目，掌握MapReduce编程
MapReduce 是一种可用于数据处理的编程模型。该模型比较简单，但要想写出有用的程序却不太容易。

Smy1121
发表于2019-06-20 13:21:44
6384 0 0

6.3k 0 0

MapReduce 是一种可用于数据处理的编程模型。该模型比较简单，但要想写出有用的程序却不太容易。
Hadoop MapReduce
Eclipse搭建hadoop开发环境
前面已经搭建了一个伪分布模式的Hadoop运行环境。绝大多数同学都习惯在Eclipse中做Java开发，本片主要讲的是如何搭建一个基于Eclipse IDE的Hadoop开发环境。

Smy1121
发表于2019-06-20 11:03:23
8251 1 0

8.2k 1 0

前面已经搭建了一个伪分布模式的Hadoop运行环境。绝大多数同学都习惯在Eclipse中做Java开发，本片主要讲的是如何搭建一个基于Eclipse IDE的Hadoop开发环境。
Hadoop Eclipse
Hadoop伪分布式集群的安装部署
Hadoop伪分布式集群的安装部署Hadoop伪分布式集群的安装部署首先可以为Linux虚拟机搭建起来的最初状态做一个快照，方便后期搭建分布式集群时多台Linux虚拟机的准备。一、如何为虚拟机做快照? 1、什么是快照？快照就是对当前的虚拟机状态进行拍照，保留虚拟机当前状态的操作信息。 2、为什么要为虚拟机做快照？第一：为克隆不同状态的虚拟机提前做准备。 ...

Smy1121
发表于2019-06-19 21:22:06
12742 2 3

12.7k 2 3

Hadoop伪分布式集群的安装部署Hadoop伪分布式集群的安装部署首先可以为Linux虚拟机搭建起来的最初状态做一个快照，方便后期搭建分布式集群时多台Linux虚拟机的准备。一、如何为虚拟机做快照? 1、什么是快照？快照就是对当前的虚拟机状态进行拍照，保留虚拟机当前状态的操作信息。 2、为什么要为虚拟机做快照？第一：为克隆不同状态的虚拟机提前做准备。 ...
网络安全分布式 Hadoop Linux
Hadoop集群规划
一、Hadoop集群环境搭建概述随着互联网，尤其是移动互联网和智能移动设备的高速发展和大面积普及，数据产生的速度以及数据累积的规模已经超过了以往任何时候，所以我们正在或者已经步入了大数据时代。对于企业来说，企业所拥有的大规模数据正逐渐成为一种重要的生产要素，但是如何盘活企业海量数据资产，充分挖掘大数据背后的价值成为新的挑战。同时也带来了很大的机遇，通过对企业海量数据的科学分析，为精益...

Smy1121
发表于2019-06-19 19:48:31
16045 0 0

16.0k 0 0

一、Hadoop集群环境搭建概述随着互联网，尤其是移动互联网和智能移动设备的高速发展和大面积普及，数据产生的速度以及数据累积的规模已经超过了以往任何时候，所以我们正在或者已经步入了大数据时代。对于企业来说，企业所拥有的大规模数据正逐渐成为一种重要的生产要素，但是如何盘活企业海量数据资产，充分挖掘大数据背后的价值成为新的挑战。同时也带来了很大的机遇，通过对企业海量数据的科学分析，为精益...
Hadoop 存储
关于大数据hadoop的35个科普小知识
1.Hadoop集群可以运行的3个模式？单机（本地）模式伪分布式模式全分布式模式2. 单机（本地）模式中的注意点？在单机模式（standalone）中不会存在守护进程，所有东西都运行在一个JVM上。这里同样没有DFS，使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序，这也是最少使用的一个模式。3. 伪分布模式中的注意点？伪分布式（Pseudo）适用于开发和测试环境，在...

杨卓宏
发表于2019-01-30 11:56:30
10262 0 0

10.2k 0 0

1.Hadoop集群可以运行的3个模式？单机（本地）模式伪分布式模式全分布式模式2. 单机（本地）模式中的注意点？在单机模式（standalone）中不会存在守护进程，所有东西都运行在一个JVM上。这里同样没有DFS，使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序，这也是最少使用的一个模式。3. 伪分布模式中的注意点？伪分布式（Pseudo）适用于开发和测试环境，在...
Hadoop 存储大数据
HBase简介及原理
HBase是一个万亿行，百万列大表(Big Table)，数据存放在hdfs集群中

淼淼之森
发表于2019-01-30 11:38:47
10951 0 2

10.9k 0 2

HBase是一个万亿行，百万列大表(Big Table)，数据存放在hdfs集群中
HBase Hadoop
Hadoop单机模式安装-安装和配置Hadoop
网络上关于如何单机模式安装Hadoop的文章很多，按照其步骤走下来多数都失败，按照其操作弯路走过了不少但终究还是把问题都解决了，所以顺便自己详细记录下完整的安装过程。此篇主要介绍在Ubuntu安装完毕后，如何进行Hadoop的安装和配置。我所记录的笔记适合没有Linux基础的朋友跟我一起操作，同时欢迎高手参观指导。环境约定以下环境基于攥写时间：5th July 201...

changfupaul
发表于2019-01-29 09:48:13
6442 0 0

6.4k 0 0

网络上关于如何单机模式安装Hadoop的文章很多，按照其步骤走下来多数都失败，按照其操作弯路走过了不少但终究还是把问题都解决了，所以顺便自己详细记录下完整的安装过程。此篇主要介绍在Ubuntu安装完毕后，如何进行Hadoop的安装和配置。我所记录的笔记适合没有Linux基础的朋友跟我一起操作，同时欢迎高手参观指导。环境约定以下环境基于攥写时间：5th July 201...
Hadoop Linux
hadoop: hive 1.2.0 在mac机上的安装与配置
环境：mac OS X Yosemite + hadoop 2.6.0 + hive 1.2.0 + jdk 1.7.0_79前提：hadoop必须先安装，且处于运行状态（伪分式模式或全分布模式均可）hive官网地址：http://hive.apache.org/建议：经个人实践，在mac OS X Yosemite 环境下，如果使用apache下载的原始hadoop 2.6.0，不管jdk...

changfupaul
发表于2019-01-29 09:34:40
10141 0 0

10.1k 0 0

环境：mac OS X Yosemite + hadoop 2.6.0 + hive 1.2.0 + jdk 1.7.0_79前提：hadoop必须先安装，且处于运行状态（伪分式模式或全分布模式均可）hive官网地址：http://hive.apache.org/建议：经个人实践，在mac OS X Yosemite 环境下，如果使用apache下载的原始hadoop 2.6.0，不管jdk...
macOS Hadoop Hive
为什么自己搭建的hadoop集群只有1个datanode
经过诊断是因为集群重新格式化过dfs/name/current/VERSION记录的内容跟实际集群的ID 不一样，datanode 能启动[root@vm112 current]# cat /opt/hadoop-2.8.4/tmp1/dfs/name/current/VERSION#Sat Jan 26 21:36:39 CST 2019namespaceID=14236026...

tscswcn
发表于2019-01-27 00:01:55
5275 0 0

5.2k 0 0

经过诊断是因为集群重新格式化过dfs/name/current/VERSION记录的内容跟实际集群的ID 不一样，datanode 能启动[root@vm112 current]# cat /opt/hadoop-2.8.4/tmp1/dfs/name/current/VERSION#Sat Jan 26 21:36:39 CST 2019namespaceID=14236026...
Hadoop

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript