Hadoop_标签_开发者

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

MapReduce快速入门系列(4) | Hadoop序列化
Hello，大家好，本次为大家带来的是Hadoop的序列化操作。目录一. 序列化的简单介绍1.1. 什么是序列化1.2. 为什么要序列化1.3. 为什么不用Java的序列化二. 自定义bean对象实现序列化接口三. 序列化的实际操作展示3.1. 需求3.2. 需求分析3.3. 编写MapReduce程序1. 编写流量统计的Bean对象2. ...

不温卜火
发表于2020-12-02 23:43:45
7101 0 0

7.1k 0 0

Hello，大家好，本次为大家带来的是Hadoop的序列化操作。目录一. 序列化的简单介绍1.1. 什么是序列化1.2. 为什么要序列化1.3. 为什么不用Java的序列化二. 自定义bean对象实现序列化接口三. 序列化的实际操作展示3.1. 需求3.2. 需求分析3.3. 编写MapReduce程序1. 编写流量统计的Bean对象2. ...
Hadoop MapReduce
Spark Core快速入门系列(11) | 文件中数据的读取和保存
大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...

不温卜火
发表于2020-12-02 23:22:32
5647 0 0

5.6k 0 0

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...
Hadoop spark
HDFS系列(1) | HDFS文件系统的简单介绍
在Hadoop分布式环境搭建(简单高效~)这篇博客中,博主在最后为大家带来了HDFS的初体验。但是当时只是尝试测试一下集群是否有错误，因此，本篇博文为大家带来HDFS的文件系统介绍。在介绍文件系统之前我们首先需要了解HDFS的作用。我们都知道HDFS是Hadoop的一个核心组件，那在Hadoop中HDFS扮演着怎样的一个角色呢？我们可以通过下图直观的了解。...

不温卜火
发表于2020-12-02 23:10:51
5817 0 0

5.8k 0 0

在Hadoop分布式环境搭建(简单高效~)这篇博客中,博主在最后为大家带来了HDFS的初体验。但是当时只是尝试测试一下集群是否有错误，因此，本篇博文为大家带来HDFS的文件系统介绍。在介绍文件系统之前我们首先需要了解HDFS的作用。我们都知道HDFS是Hadoop的一个核心组件，那在Hadoop中HDFS扮演着怎样的一个角色呢？我们可以通过下图直观的了解。...
Hadoop 分布式
HDFS系列(3) | HDFS的Shell常用命令大全
此次更新的的博文是关于HDFS的shell的常用命令，希望大家能够喜欢目录一. 基本语法二. 命令大全三. 常用命令实操1. 常用命令及其作用对比表2. 常用命令的实际操作一. 基本语法 bin/hadoop fs 具体命令 or bin/hdfs dfs 具体命令都是可以的。二. 命令大全在虚拟机内输入：bin/hd...

不温卜火
发表于2020-12-02 23:03:27
10961 0 0

10.9k 0 0

此次更新的的博文是关于HDFS的shell的常用命令，希望大家能够喜欢目录一. 基本语法二. 命令大全三. 常用命令实操1. 常用命令及其作用对比表2. 常用命令的实际操作一. 基本语法 bin/hadoop fs 具体命令 or bin/hdfs dfs 具体命令都是可以的。二. 命令大全在虚拟机内输入：bin/hd...
Hadoop Shell
Spark SQL 快速入门系列(8) | | Hive与Spark SQL的读写操作
大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...

不温卜火
发表于2020-12-02 23:02:08
5584 0 0

5.5k 0 0

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...
Hadoop Hive spark SQL
基于CentOS6.4环境编译Spark-2.1.0源码
基于CentOS6.4环境编译Spark-2.1.0源码 1 写在前面的话有些小伙伴可能会问：Spark官网不是已经提供了Spark针对不同版本的安装包了吗，我们为什么还需要对Spark源码进行编译呢？针对这个问题我们到Spark官网: spark.apache.org来看下，如下图所示: Spark官网的确是提供了一些Hadoop版本的Spark安装包，但...

小米粒-biubiubiu
发表于2020-12-02 22:59:35
6853 0 0

6.8k 0 0

基于CentOS6.4环境编译Spark-2.1.0源码 1 写在前面的话有些小伙伴可能会问：Spark官网不是已经提供了Spark针对不同版本的安装包了吗，我们为什么还需要对Spark源码进行编译呢？针对这个问题我们到Spark官网: spark.apache.org来看下，如下图所示: Spark官网的确是提供了一些Hadoop版本的Spark安装包，但...
CentOS Hadoop spark
HDFS系列(7) | HDFS的 I/O流 API操作
上一篇博文我们分享的API操作HDFS系统都是框架封装好的。那么如果我们想自己实现上述API的操作该怎么实现呢？此次物品们介绍的是采用I/O流的方式实现数据的上传和下载。目录一. HDFS文件上传二. HDFS文件下载三. 定位文件读取一. HDFS文件上传需求：把本地d盘上的lisen.txt文件上传到HDFS根目录 1....

不温卜火
发表于2020-12-02 22:57:07
6898 0 0

6.8k 0 0

上一篇博文我们分享的API操作HDFS系统都是框架封装好的。那么如果我们想自己实现上述API的操作该怎么实现呢？此次物品们介绍的是采用I/O流的方式实现数据的上传和下载。目录一. HDFS文件上传二. HDFS文件下载三. 定位文件读取一. HDFS文件上传需求：把本地d盘上的lisen.txt文件上传到HDFS根目录 1....
API Hadoop
Hive快速入门系列(7) | Hive常见的属性配置
本次博主为大家带来的事Hive常见的属性配置。希望能够帮助大家。目录一. Hive数据仓库位置配置二. 查询后信息显示配置三. Hive运行日志信息配置四. 参数配置方式4.1 查看当前所有的配置信息4.2 参数的配置三种方式一. Hive数据仓库位置配置 1. Default数据仓库的最原始位置是在hdfs上的：/user/hi...

不温卜火
发表于2020-12-02 22:55:05
7171 0 0

7.1k 0 0

本次博主为大家带来的事Hive常见的属性配置。希望能够帮助大家。目录一. Hive数据仓库位置配置二. 查询后信息显示配置三. Hive运行日志信息配置四. 参数配置方式4.1 查看当前所有的配置信息4.2 参数的配置三种方式一. Hive数据仓库位置配置 1. Default数据仓库的最原始位置是在hdfs上的：/user/hi...
Hadoop Hive
Flume快速入门系列(4) | 多路复用
此篇博文讲的是Flume的多路复用。目录 1. 案例需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume-file-flume.conf3. 创建flume-flume-hdfs.conf4. 创建flume-flume-dir.conf5. 执行配置文件6. 启动Hadoop和Hive7. 检查HDFS上数据8. 检查/opt/modul...

不温卜火
发表于2020-12-02 22:52:26
4061 0 0

4.0k 0 0

此篇博文讲的是Flume的多路复用。目录 1. 案例需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume-file-flume.conf3. 创建flume-flume-hdfs.conf4. 创建flume-flume-dir.conf5. 执行配置文件6. 启动Hadoop和Hive7. 检查HDFS上数据8. 检查/opt/modul...
Hadoop
Yarn快速系列入门(4) | Yarn调度器
本篇博文，博主为大家介绍Yarn调度器。目录一. Yarn调度器(Scheduler)介绍1.1 FIFO Scheduler （队列调度器）1.2 capacity scheduler（容量调度器，apache版本默认使用的调度器）1.3 Fair Scheduler（公平调度器，CDH版本的hadoop默认使用的调度器）1.4 小结二. yarn...

不温卜火
发表于2020-12-02 22:52:24
9430 0 0

9.4k 0 0

本篇博文，博主为大家介绍Yarn调度器。目录一. Yarn调度器(Scheduler)介绍1.1 FIFO Scheduler （队列调度器）1.2 capacity scheduler（容量调度器，apache版本默认使用的调度器）1.3 Fair Scheduler（公平调度器，CDH版本的hadoop默认使用的调度器）1.4 小结二. yarn...
Hadoop Yarn
在Linux中部署集群(零基础速学！)
博主上篇的文章讲的是伪分布式部署，那么接下来进行分布时的教学，先从搭建集群开始，为分布式开发环境做准备。目录 1. 克隆虚拟机2. 更改系统的mac地址3. 更改网卡信息4. 更改主机名5. 添加别名6. 关闭防火墙7. 关闭selinux8. SCP远程文件拷贝9. SSH 远程登录1. 基于密码的登录2. 无密钥配置(免密登录) 10. 总...

不温卜火
发表于2020-12-02 22:44:32
4305 0 0

4.3k 0 0

博主上篇的文章讲的是伪分布式部署，那么接下来进行分布时的教学，先从搭建集群开始，为分布式开发环境做准备。目录 1. 克隆虚拟机2. 更改系统的mac地址3. 更改网卡信息4. 更改主机名5. 添加别名6. 关闭防火墙7. 关闭selinux8. SCP远程文件拷贝9. SSH 远程登录1. 基于密码的登录2. 无密钥配置(免密登录) 10. 总...
Hadoop Linux
HDFS系列(2) | HDFS优缺点分析
因为在上期的分享中,大家看到的更多是HDFS的底层原理,内部结构,并没有谈到其自身优势和劣势的一个比较！因此,本次博主为大家带来的就是对HDFS的优缺点进行分析。目录一. HDFS的优点1. 高容错性2. 适合处理大数据3. 实用性强二. HDFS的缺点1. 不适合低延时数据访问2. 无法高效的对大量小文件进行存储3. 不支持并发写入、文件...

不温卜火
发表于2020-12-02 22:36:19
6031 0 0

6.0k 0 0

因为在上期的分享中,大家看到的更多是HDFS的底层原理,内部结构,并没有谈到其自身优势和劣势的一个比较！因此,本次博主为大家带来的就是对HDFS的优缺点进行分析。目录一. HDFS的优点1. 高容错性2. 适合处理大数据3. 实用性强二. HDFS的缺点1. 不适合低延时数据访问2. 无法高效的对大量小文件进行存储3. 不支持并发写入、文件...
Hadoop
Flume快速入门系列(1) | Flume的简单介绍
在一个完整的离线大数据处理系统中，除了HDFS+MapReduce+Hive组成分析系统的核心之外，还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统，而这些辅助工具在hadoop生态体系中都有便捷的开源框架，在此，我们首先来介绍下数据采集部分所用的的开源框架——Flume。目录 1. Flume定义2. Flume的优点3. Flume采集系...

不温卜火
发表于2020-12-02 22:35:04
4534 0 0

4.5k 0 0

在一个完整的离线大数据处理系统中，除了HDFS+MapReduce+Hive组成分析系统的核心之外，还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统，而这些辅助工具在hadoop生态体系中都有便捷的开源框架，在此，我们首先来介绍下数据采集部分所用的的开源框架——Flume。目录 1. Flume定义2. Flume的优点3. Flume采集系...
Hadoop
Flume快速入门系列(6) | 聚合
此篇博文讲的是Flume的聚合。目录 1. 需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume1-logger-flume.conf3. 创建flume2-netcat-flume.conf4. 创建flume3-flume-logger.conf5. 执行配置文件6. 在hadoop003上向/opt/module目录下的group.l...

不温卜火
发表于2020-12-02 00:58:30
3708 0 0

3.7k 0 0

此篇博文讲的是Flume的聚合。目录 1. 需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume1-logger-flume.conf3. 创建flume2-netcat-flume.conf4. 创建flume3-flume-logger.conf5. 执行配置文件6. 在hadoop003上向/opt/module目录下的group.l...
Hadoop
数据科学家必备工具有哪些？
当数据科学家需要使用某些软件时，其中一部分我们已经在之前的章节中做过介绍，这些软件涵盖了数据科学家所需要的基础专业内容。实际的工作范畴可能会超越求职时候的工作描述，这也是IT工作的常态之一。这在某种程度上是好的，因为它提供了学习新技能的机会，而这也是数据科学领域最引人入胜的方面之一。在这一章中，我们会探索数据科学环境中常用的软件。不是所有在这里提到的软件都会在你的工作中用到，但了解...

且听风吟
发表于2020-02-15 14:53:45
8504 0 0

8.5k 0 0

当数据科学家需要使用某些软件时，其中一部分我们已经在之前的章节中做过介绍，这些软件涵盖了数据科学家所需要的基础专业内容。实际的工作范畴可能会超越求职时候的工作描述，这也是IT工作的常态之一。这在某种程度上是好的，因为它提供了学习新技能的机会，而这也是数据科学领域最引人入胜的方面之一。在这一章中，我们会探索数据科学环境中常用的软件。不是所有在这里提到的软件都会在你的工作中用到，但了解...
Hadoop 数据挖掘

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript