Hadoop_标签_开发者_华为云

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

Hadoop概述
Hadoop概述

兮动人
发表于2021-08-14 10:47:37
3333 0 0

3.3k 0 0

Hadoop概述
Hadoop MapReduce
大数据全栈课心得与总结
经历了三个阶段大概三个月的学习，大数据全栈课程迎来了尾声，今天是大数据三阶段的最后一天，也是整个大数据课程的最后一天。这三个月的学习过程，并不是一帆风顺，而且一路荆棘。第一阶段：大数据入门篇第一阶段的课程主要是大数据的入门知识，包括MySQL基本知识、各种概念和常用语句、JDBC的使用还有数据库事务等等，虽然是基础知识，但是非常实用，在开发中会经常用到，基本上就是对数据库的各...

蜡笔不辣
发表于2021-04-11 22:18:20
6743 0 0

6.7k 0 0

经历了三个阶段大概三个月的学习，大数据全栈课程迎来了尾声，今天是大数据三阶段的最后一天，也是整个大数据课程的最后一天。这三个月的学习过程，并不是一帆风顺，而且一路荆棘。第一阶段：大数据入门篇第一阶段的课程主要是大数据的入门知识，包括MySQL基本知识、各种概念和常用语句、JDBC的使用还有数据库事务等等，虽然是基础知识，但是非常实用，在开发中会经常用到，基本上就是对数据库的各...
Hadoop 大数据
spark入门
1. Spark概述1.1. 什么是Spark（官网：http://spark.apache.org） Spark是一种快速、通用、可扩展的大数据分析引擎，2009年诞生于加州大学伯克利分校AMPLab，2010年开源，2013年6月成为Apache孵化项目，2014年2月成为Apache顶级项目。目前，Spark生态系统已经发展成为一个包含多个子项目的集合，其中包含SparkSQL、Spa...

菜鸟级攻城狮
发表于2021-03-14 15:26:28
5188 0 0

5.1k 0 0

1. Spark概述1.1. 什么是Spark（官网：http://spark.apache.org） Spark是一种快速、通用、可扩展的大数据分析引擎，2009年诞生于加州大学伯克利分校AMPLab，2010年开源，2013年6月成为Apache孵化项目，2014年2月成为Apache顶级项目。目前，Spark生态系统已经发展成为一个包含多个子项目的集合，其中包含SparkSQL、Spa...
Hadoop spark
记一次HBase写入优化测试
HBase提高写入速度参数配置-测试案例

穆生生
发表于2021-02-26 15:21:44
11610 0 0

11.6k 0 0

HBase提高写入速度参数配置-测试案例
Hadoop HBase
【学习笔记】大数据全栈成长计划第二阶段-第二章-第二节：Hadoop优势
第二节：Hadoop优势Hadoop的优势（4高）1）高可靠性：Hadoop底层维护多个数据副本，所以即时Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失2）高扩展性：在集群间分配任务数据，可方便的扩展数以千计的节点3）高效性：在MapReduce的思想下，Hadoop是并行工作的，以加快任务处理速度4）高容错性：能够自动将失败任务重新分配Hadoop1.x和2.x的区别Had...

真爱无敌
发表于2021-02-24 13:28:11
4867 0 0

4.8k 0 0

第二节：Hadoop优势Hadoop的优势（4高）1）高可靠性：Hadoop底层维护多个数据副本，所以即时Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失2）高扩展性：在集群间分配任务数据，可方便的扩展数以千计的节点3）高效性：在MapReduce的思想下，Hadoop是并行工作的，以加快任务处理速度4）高容错性：能够自动将失败任务重新分配Hadoop1.x和2.x的区别Had...
Hadoop 大数据
【学习笔记】大数据全栈成长计划第二阶段-第二章-第一节：什么是Hadoop
第一节：什么是Hadoop1）Hadoop是一个有Apache基金会所开发的分布式系统基础架构2）主要解决：海量数据的存储和海量数据的分析计算问题3）广义上来说，Hadoop通常是指一个更广泛的概念--Hadoop生态圈Hadoop发展史：1）Lucene框架是Doug Cutting开创的开源软件，用Java书写代码，实现与Google类似的全文搜索功能，它提供了全文检索引擎的架构，包括...

真爱无敌
发表于2021-02-24 13:25:05
5241 0 0

5.2k 0 0

第一节：什么是Hadoop1）Hadoop是一个有Apache基金会所开发的分布式系统基础架构2）主要解决：海量数据的存储和海量数据的分析计算问题3）广义上来说，Hadoop通常是指一个更广泛的概念--Hadoop生态圈Hadoop发展史：1）Lucene框架是Doug Cutting开创的开源软件，用Java书写代码，实现与Google类似的全文搜索功能，它提供了全文检索引擎的架构，包括...
Hadoop 大数据
关于 Hadoop 启动时报错 masternode:ssh: connect to host master port 22:
最近在 Win10 系统上配置了ubuntu-18.04.3，在配置集群的 ssh 无秘钥登录时，经常能碰到 ssh: connect to host master port 22: Connection timed out 的问题。

白鹿第一帅
发表于2021-02-11 20:15:51
8316 0 0

8.3k 0 0

最近在 Win10 系统上配置了ubuntu-18.04.3，在配置集群的 ssh 无秘钥登录时，经常能碰到 ssh: connect to host master port 22: Connection timed out 的问题。
BigData Pro 大数据 Hadoop ssh
华为云FusionInsight MRS金融行业首个1000+大集群滚动升级成功
2020年8月27日，中国工商银行联合华为完成了金融行业首家规模超千台的Hadoop集群大版本滚动升级，为期两周的升级过程突破了传统的离线升级模式，真正实现了业务无感的平滑滚动升级。全程集群作业无中断、性能无影响，为全行上百个应用、上千个场景、上万个作业保障了7*24小时不间断的数据服务。本次滚动升级对金融科技领域意义重大，中国工商银行为金融同业树立了大数据服务连续性上的建设标杆。

Sailing27
发表于2021-01-28 20:49:35
13529 0 1

13.5k 0 1

2020年8月27日，中国工商银行联合华为完成了金融行业首家规模超千台的Hadoop集群大版本滚动升级，为期两周的升级过程突破了传统的离线升级模式，真正实现了业务无感的平滑滚动升级。全程集群作业无中断、性能无影响，为全行上百个应用、上千个场景、上万个作业保障了7*24小时不间断的数据服务。本次滚动升级对金融科技领域意义重大，中国工商银行为金融同业树立了大数据服务连续性上的建设标杆。
EI企业智能 FusionInsight Hadoop 大数据
Hadoop原生平台安装HA版本
1.增加了Resourcemanager的HA,并进行测试 2.增加了Job History Serve的配置 3.增加HBase的搭建

菜鸟级攻城狮
发表于2021-01-26 11:35:51
18543 0 1

18.5k 0 1

1.增加了Resourcemanager的HA,并进行测试 2.增加了Job History Serve的配置 3.增加HBase的搭建
Hadoop 虚拟化
EulerOS 2.8 编译Hadoop 3.1.1
问题现象和分析过程：1、在hadoop-3.1.1-src目录中执行 mvn package -DskipTests -Pdist,native -Dtar -Dmaven.javadoc.skip=true 过程中提示“rpc/types.h:No such file or directory”hadoop-3.1.1-src/hadoop-tools/hadoop-pipes/src/...

Kongfu Panda
发表于2021-01-12 15:50:13
4321 0 0

4.3k 0 0

问题现象和分析过程：1、在hadoop-3.1.1-src目录中执行 mvn package -DskipTests -Pdist,native -Dtar -Dmaven.javadoc.skip=true 过程中提示“rpc/types.h:No such file or directory”hadoop-3.1.1-src/hadoop-tools/hadoop-pipes/src/...
Hadoop
HDFS必须要了解的知识点
HDFS 就是Hadoop 分布式文件系统，也是Hadoop的三大重要组件之一,它主要是处理大数据场景下数据的增、删、改、查，因此它的场景特点有：数据量非常大、一般适合存储读写大文件、对于文件数据的可靠性要求较高。HDFS主要的三大组件分别是Client、Namenode、Datanode;其中Client作为HDFS对外提供服务的一个接口，能否让用户的分布式操作和在一台主机操作一样的方便，...

huangruie
发表于2020-02-21 18:22:06
12174 0 0

12.1k 0 0

HDFS 就是Hadoop 分布式文件系统，也是Hadoop的三大重要组件之一,它主要是处理大数据场景下数据的增、删、改、查，因此它的场景特点有：数据量非常大、一般适合存储读写大文件、对于文件数据的可靠性要求较高。HDFS主要的三大组件分别是Client、Namenode、Datanode;其中Client作为HDFS对外提供服务的一个接口，能否让用户的分布式操作和在一台主机操作一样的方便，...
Hadoop 存储
HDFS官网翻译——HDFS 架构指南（四）
文件系统元数据的持久性HDFS命名空间存储在NameNode结点中。NameNode使用Editlog记录文件系统元数据的每一次变更。Editlog是一个事务型日志。例如，HDFS创建新文件时会在Editlog文件中插入一条记录。类似地，文件副本数的变更也会引起在Editlog文件中记录一条日志。NameNode结点使用本地文件系统存储Editlog文件。FsImage文件中存储了文件系统命...

敏敏君主
发表于2021-02-02 20:08:52
11615 0 0

11.6k 0 0

文件系统元数据的持久性HDFS命名空间存储在NameNode结点中。NameNode使用Editlog记录文件系统元数据的每一次变更。Editlog是一个事务型日志。例如，HDFS创建新文件时会在Editlog文件中插入一条记录。类似地，文件副本数的变更也会引起在Editlog文件中记录一条日志。NameNode结点使用本地文件系统存储Editlog文件。FsImage文件中存储了文件系统命...
Hadoop 机器翻译
HDFS官网翻译——HDFS 架构指南（一）
翻译https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html-----------------------------------------------------------------------------------------------介绍HDFS，The Hadoop Distributed FIle System 是设计用...

敏敏君主
发表于2021-01-28 20:00:19
12548 0 0

12.5k 0 0

翻译https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html-----------------------------------------------------------------------------------------------介绍HDFS，The Hadoop Distributed FIle System 是设计用...
Hadoop 机器翻译
《Hadoop权威指南：大数据的存储与分析》
本节书摘来自清华大学出版社《Hadoop权威指南：大数据的存储与分析》一作者是Tom White ，王海华东刘喻吕粤海译。

清华大学出版社
发表于2019-10-12 12:32:27
11856 0 0

11.8k 0 0

本节书摘来自清华大学出版社《Hadoop权威指南：大数据的存储与分析》一作者是Tom White ，王海华东刘喻吕粤海译。
大数据 Hadoop
《大数据技术丛书 Flink原理、实战与性能优化》—2环境准备
本节书摘来自华章计算机《大数据技术丛书 Flink原理、实战与性能优化》一书中的第2章，第2.1节，作者是张利兵。

华章计算机
发表于2019-06-14 16:28:03
4586 0 0

4.5k 0 0

本节书摘来自华章计算机《大数据技术丛书 Flink原理、实战与性能优化》一书中的第2章，第2.1节，作者是张利兵。
大数据 Hadoop

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript