Hadoop_标签_开发者

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

hive数据迁移到clickhouse—使用Waterdrop工具
hive数据迁移到clickhouse—使用Waterdrop工具参考链接基于荣耀客户的需求，测试Waterdrop从云EI的hive-spark集群上迁移数据到clickhouse集群 hive数据迁移到clickhouse—使用Waterdrop工具 Waterdrop hive-spark集群 clickhouse集群 batch.conf 数据迁移迁移结果 waterdrop性能...

陈方业
发表于2021-05-25 14:33:36
11745 0 1

11.7k 0 1

hive数据迁移到clickhouse—使用Waterdrop工具参考链接基于荣耀客户的需求，测试Waterdrop从云EI的hive-spark集群上迁移数据到clickhouse集群 hive数据迁移到clickhouse—使用Waterdrop工具 Waterdrop hive-spark集群 clickhouse集群 batch.conf 数据迁移迁移结果 waterdrop性能...
ClickHouse Hadoop Hive 数据迁移
图文详解 HDFS 组成框架
介绍了HDFS是什么、HDFS的优缺点，NameNode节点、DataNode节点、SecondaryNameNode节点的定义及功能介绍。

烟雨江南
发表于2021-05-19 02:33:00
21289 0 0

21.2k 0 0

介绍了HDFS是什么、HDFS的优缺点，NameNode节点、DataNode节点、SecondaryNameNode节点的定义及功能介绍。
Hadoop 分布式大数据
【大数据全栈成长计划 Hadoop学习篇】第三阶段最终积分排行榜和最终考核成绩出炉！
各位进阶中的开发者们，大数据全栈成长计划第三阶段所有学习任务都已经结束大家心心念念的最终积分排行榜也已经出炉我们设置学习任务的目的就是想让大家在听课之余，用作业和心得来检验自己的学习成果最终积分排名会按照活动帖中符合条件的1-50名有实体奖品当排名节点处出现同分时，我们的评判标准为：阶段考核>问答官>分享转发>每周学习笔记>每章随堂测验；根据每个项目打卡时间的先后顺序排名积分统计依据：序号阶...

7号小助手
发表于2021-05-02 17:24:05
6704 0 0

6.7k 0 0

各位进阶中的开发者们，大数据全栈成长计划第三阶段所有学习任务都已经结束大家心心念念的最终积分排行榜也已经出炉我们设置学习任务的目的就是想让大家在听课之余，用作业和心得来检验自己的学习成果最终积分排名会按照活动帖中符合条件的1-50名有实体奖品当排名节点处出现同分时，我们的评判标准为：阶段考核>问答官>分享转发>每周学习笔记>每章随堂测验；根据每个项目打卡时间的先后顺序排名积分统计依据：序号阶...
Hadoop 大数据
搭建HDFS的HA环境(HBase安装及配置,启动)
1、在软件包所在目录解压Hbase压缩包[root@win1 soft]# tar -zxvf hbase-1.3.2-bin.tar.gz[root@win1 soft]# lshadoop-2.7.7 hbase-1.3.2 jdk1.8.0_161 zookeeper-3.4.12hadoop-2.7.7.tar.gz hbase-...

菜鸟级攻城狮
发表于2021-02-28 08:32:34
6537 0 1

6.5k 0 1

1、在软件包所在目录解压Hbase压缩包[root@win1 soft]# tar -zxvf hbase-1.3.2-bin.tar.gz[root@win1 soft]# lshadoop-2.7.7 hbase-1.3.2 jdk1.8.0_161 zookeeper-3.4.12hadoop-2.7.7.tar.gz hbase-...
Hadoop HBase 大数据
大数据基础学习四：伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤、易错点分析及需要注意的问题
大数据基础学习四：伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤、易错点分析及需要注意的问题（以 ubuntu-18.04.3、hadoop-3.2.1-tar.gz 为例），本系列的其他文章可以移步本人大数据专栏进行查看。对于本篇文章，我个人是很有自信的，一篇文章掌握一门课程核心技术点。

白鹿第一帅
发表于2021-02-07 16:28:23
8039 0 1

8.0k 0 1

大数据基础学习四：伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤、易错点分析及需要注意的问题（以 ubuntu-18.04.3、hadoop-3.2.1-tar.gz 为例），本系列的其他文章可以移步本人大数据专栏进行查看。对于本篇文章，我个人是很有自信的，一篇文章掌握一门课程核心技术点。
Hadoop Ubuntu 分布式大数据
解决 Apache Hadoop 启动时 DataNode 没有启动的问题（注意这会删除 HDFS 中原有的所有数据）
解决 Apache Hadoop 启动时 DataNode 没有启动的问题（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）。

白鹿第一帅
发表于2021-02-07 15:33:38
8718 0 0

8.7k 0 0

解决 Apache Hadoop 启动时 DataNode 没有启动的问题（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）。
Apache Hadoop
【大数据计算】(一) HDFS操作方法和基础编程
1. HDFS操作常用Shell命令 1.1 查看命令使用方法启动Hadoop start-dfs.sh 1 查看各种命令 hdfs dfs -help 1 1.2 HDFS目录操作 ...

小生凡一
发表于2021-10-15 22:03:43
5551 0 0

5.5k 0 0

1. HDFS操作常用Shell命令 1.1 查看命令使用方法启动Hadoop start-dfs.sh 1 查看各种命令 hdfs dfs -help 1 1.2 HDFS目录操作 ...
Hadoop 大数据
如何避免Spark SQL做数据导入时产生大量小文件
01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...

数据湖爱好者
发表于2021-05-13 15:40:29
14627 0 0

14.6k 0 0

01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...
EI企业智能 Hadoop spark 数据湖探索 DLI 智能数据
【详解】HadoopCouldnotlocateexecutablenull解决办法
Hadoop Could not locate executable null 解决办法在使用Hadoop进行大数据处理时，可能会遇到“Could not locate executable null”这样的错误。这个错误通常出现在执行MapReduce任务时，表示Hadoop无法找到某个可执行文件。本文将探讨该问题的可能原因及解决方法。1. 错误现象当你尝试运行一个MapReduce作业时...

皮牙子抓饭
发表于2025-01-05 22:11:56
9322 0 0

9.3k 0 0

Hadoop Could not locate executable null 解决办法在使用Hadoop进行大数据处理时，可能会遇到“Could not locate executable null”这样的错误。这个错误通常出现在执行MapReduce任务时，表示Hadoop无法找到某个可执行文件。本文将探讨该问题的可能原因及解决方法。1. 错误现象当你尝试运行一个MapReduce作业时...
Hadoop Java
Python与HDFS的结合：高效处理分布式数据
在大数据处理领域，Hadoop分布式文件系统（HDFS）是一种非常常用的存储解决方案，尤其适用于存储和管理大量的结构化或非结构化数据。HDFS的分布式特性和高容错能力使其成为处理大规模数据集的首选平台。而Python作为一种流行的编程语言，拥有丰富的生态系统，可以与HDFS进行无缝集成，用于大规模数据的存储、管理和处理。本文将介绍如何使用Python与HDFS结合，以高效处理分布式数据。我们...

数字扫地僧
发表于2024-12-20 14:18:18
5747 0 0

5.7k 0 0

在大数据处理领域，Hadoop分布式文件系统（HDFS）是一种非常常用的存储解决方案，尤其适用于存储和管理大量的结构化或非结构化数据。HDFS的分布式特性和高容错能力使其成为处理大规模数据集的首选平台。而Python作为一种流行的编程语言，拥有丰富的生态系统，可以与HDFS进行无缝集成，用于大规模数据的存储、管理和处理。本文将介绍如何使用Python与HDFS结合，以高效处理分布式数据。我们...
Hadoop Python 分布式
Python与大数据：Hadoop与PySpark的整合
在现代大数据应用中，Hadoop和Spark作为两种主流的大数据处理框架，广泛用于数据存储、处理和分析。Hadoop主要用于分布式存储（通过HDFS）和分布式计算（通过MapReduce），而Spark则提供了更高效、易用的处理能力，特别适合批量和流数据的处理。Python作为一种易于学习和使用的编程语言，结合Hadoop和Spark的能力，可以大大提升大数据处理的效率和便捷性。本文将介绍如...

数字扫地僧
发表于2024-12-03 13:06:31
3926 0 0

3.9k 0 0

在现代大数据应用中，Hadoop和Spark作为两种主流的大数据处理框架，广泛用于数据存储、处理和分析。Hadoop主要用于分布式存储（通过HDFS）和分布式计算（通过MapReduce），而Spark则提供了更高效、易用的处理能力，特别适合批量和流数据的处理。Python作为一种易于学习和使用的编程语言，结合Hadoop和Spark的能力，可以大大提升大数据处理的效率和便捷性。本文将介绍如...
Hadoop Python 大数据
详解WARN util.NativeCodeLoader: Unable to load native-hadoop libra
详解WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable最近，你在使用Hadoop开源分布式处理框架时，可能会遇到如下警告信息：plaintextCopy codeWARN util.Na...

皮牙子抓饭
发表于2024-11-29 10:37:07
3829 0 0

3.8k 0 0

详解WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable最近，你在使用Hadoop开源分布式处理框架时，可能会遇到如下警告信息：plaintextCopy codeWARN util.Na...
Hadoop 大数据
【大数据技术基础 | 实验五】ZooKeeper实验：部署ZooKeeper
本实验介绍部署ZooKeeper的原理和实验步骤。部署三个节点的ZooKeeper集群，通过ZooKeeper客户端连接ZooKeeper集群，并用Shell命令练习创建目录，查询目录等。

Francek Chen
发表于2024-11-11 19:40:26
5476 0 0

5.4k 0 0

本实验介绍部署ZooKeeper的原理和实验步骤。部署三个节点的ZooKeeper集群，通过ZooKeeper客户端连接ZooKeeper集群，并用Shell命令练习创建目录，查询目录等。
Hadoop ZooKeeper 分布式大数据
【大数据技术基础 | 实验四】HDFS实验：读写HDFS文件
本文介绍HDFS读写文件的相关原理和实验步骤。搭建HDFS开发环境，分别在master服务器上和Eclipse环境中编写了HDFS写、读代码，在master机上执行了该写、读程序。通过实验了解HDFS读写文件的调用流程，理解HDFS读写文件的原理。

Francek Chen
发表于2024-11-11 19:34:47
6928 0 0

6.9k 0 0

本文介绍HDFS读写文件的相关原理和实验步骤。搭建HDFS开发环境，分别在master服务器上和Eclipse环境中编写了HDFS写、读代码，在master机上执行了该写、读程序。通过实验了解HDFS读写文件的调用流程，理解HDFS读写文件的原理。
Hadoop hdfs 分布式大数据
【大数据技术基础 | 实验三】HDFS实验：部署HDFS
本文介绍部署HDFS相关原理和实验步骤。理解HDFS体系架构和master/slave架构，学会逐一启动HDFS和统一启动HDFS，并完成在HDFS中新建目录和上传文件。

Francek Chen
发表于2024-11-11 19:24:23
5235 0 0

5.2k 0 0

本文介绍部署HDFS相关原理和实验步骤。理解HDFS体系架构和master/slave架构，学会逐一启动HDFS和统一启动HDFS，并完成在HDFS中新建目录和上传文件。
Hadoop hdfs 分布式大数据

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript