Hadoop_标签_开发者_华为云

博客(763)
视频(1)
论坛(0)
云声(0)
代码示例(0)

Volatile关键字的作用和实现原理
推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接玩转cloud Studio 在线编码神器玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间文章字数统计：共3072字。阅读预计10分钟 1. 引言在多线程编程中，为了保证线程间的共享变量的可见性和正确性，我们需要使用同步机制来进行线程间的通信和数据同步。而Java中的Volatile关键字就...

赵KK日常技术记录
发表于2023-09-23 16:25:54
1950 0 0

1.9k 0 0

推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接玩转cloud Studio 在线编码神器玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间文章字数统计：共3072字。阅读预计10分钟 1. 引言在多线程编程中，为了保证线程间的共享变量的可见性和正确性，我们需要使用同步机制来进行线程间的通信和数据同步。而Java中的Volatile关键字就...
Hadoop Java Python TCP/IP 任务调度
深入解析：HTTP和HTTPS的三次握手与四次挥手
「java、python面试题」来自UC网盘app分享，打开手机app，额外获得1T空间https://drive.uc.cn/s/2aeb6c2dcedd4AIGC资料包https://drive.uc.cn/s/6077fc42116d4https://pan.xunlei.com/s/VN_qC7kwpKFgKLto4KgP4Do_A1?pwd=7kbv#https://yv4kfv1...

赵KK日常技术记录
发表于2023-09-23 16:24:34
2289 0 0

2.2k 0 0

「java、python面试题」来自UC网盘app分享，打开手机app，额外获得1T空间https://drive.uc.cn/s/2aeb6c2dcedd4AIGC资料包https://drive.uc.cn/s/6077fc42116d4https://pan.xunlei.com/s/VN_qC7kwpKFgKLto4KgP4Do_A1?pwd=7kbv#https://yv4kfv1...
Hadoop Python Spring TCP/IP 任务调度
大数据处理之高效查询频度排序
引言在互联网时代，数据量的爆炸增长给数据处理带来了巨大的挑战。本文将介绍如何高效地处理10个每个文件大小为1G的文件，其中每个文件的每一行存放的都是用户的查询(query)。我们的目标是按照查询的频度对这些查询进行排序。为了解决这个问题，我们将借助大数据处理技术，并给出代码示例。准备工作在开始之前，我们需要准备一些工具和环境：Hadoop：分布式计算框架，用于处理大规模数据。Hadoop...

赵KK日常技术记录
发表于2023-09-23 11:53:35
1947 0 0

1.9k 0 0

引言在互联网时代，数据量的爆炸增长给数据处理带来了巨大的挑战。本文将介绍如何高效地处理10个每个文件大小为1G的文件，其中每个文件的每一行存放的都是用户的查询(query)。我们的目标是按照查询的频度对这些查询进行排序。为了解决这个问题，我们将借助大数据处理技术，并给出代码示例。准备工作在开始之前，我们需要准备一些工具和环境：Hadoop：分布式计算框架，用于处理大规模数据。Hadoop...
Hadoop Java MapReduce MySQL Spring
Presto杂记
数据湖（datalake）通常指的是一个巨大的HDFS或类似的分布式对象存储系统，在数据被转储到这些存储系统时，并没有特别考虑接下来应如何访问它们。Presto可以使它们成为有用的数据仓库。实际上，Facebook开发的目的就是对一个非常大的Hadoop数据仓库进行更快和更强大的查询，提供Hive和其他工具无法提供的能力。这也是Hive连接器的起源。Facebook于2008年开源了Hive...

黄生
发表于2023-09-12 23:24:22
2694 1 0

2.6k 1 0

数据湖（datalake）通常指的是一个巨大的HDFS或类似的分布式对象存储系统，在数据被转储到这些存储系统时，并没有特别考虑接下来应如何访问它们。Presto可以使它们成为有用的数据仓库。实际上，Facebook开发的目的就是对一个非常大的Hadoop数据仓库进行更快和更强大的查询，提供Hive和其他工具无法提供的能力。这也是Hive连接器的起源。Facebook于2008年开源了Hive...
Hadoop Hive
Hadoop及其生态
Google公司2003年开始陆续发表的关于GFS、MapReduce和BigTable的三篇技术论文，成为大数据发展的重要基石。大数据、数据仓库、数据湖。这是三个不同的概念。若不使用数据仓库，就无法使用查询合并来自不同系统的数据。大数据的特性，是4V+1O。Volume, Variety, Value, Velocity, OnlineApache Hadoop 允许用户在不了解分布式系统...

黄生
发表于2023-09-10 16:22:26
2474 0 0

2.4k 0 0

Google公司2003年开始陆续发表的关于GFS、MapReduce和BigTable的三篇技术论文，成为大数据发展的重要基石。大数据、数据仓库、数据湖。这是三个不同的概念。若不使用数据仓库，就无法使用查询合并来自不同系统的数据。大数据的特性，是4V+1O。Volume, Variety, Value, Velocity, OnlineApache Hadoop 允许用户在不了解分布式系统...
Hadoop Hive
Apache IoTDB开发系统之Writing Data on HDFS
目前支持将 TSFile（包括 TSFile 和相关数据文件）存储在本地文件系统和 Hadoop分布式文件系统（HDFS）中。配置TSFile的存储文件系统非常容易。

小云悠悠zZ
发表于2023-09-08 09:19:57
2185 0 0

2.1k 0 0

目前支持将 TSFile（包括 TSFile 和相关数据文件）存储在本地文件系统和 Hadoop分布式文件系统（HDFS）中。配置TSFile的存储文件系统非常容易。
Apache Hadoop IoT 架构设计
Apache IoTDB开发系统整合之MapReduce TsFile
TsFile-Hadoop-Connector 实现了 Hadoop 对 Tsfile 类型的外部数据源的支持。这使用户能够通过Hadoop读取，写入和查询Tsfile。

小云悠悠zZ
发表于2023-08-31 22:14:42
2228 0 0

2.2k 0 0

TsFile-Hadoop-Connector 实现了 Hadoop 对 Tsfile 类型的外部数据源的支持。这使用户能够通过Hadoop读取，写入和查询Tsfile。
Apache Hadoop Java 架构设计
一文读懂 —— 数据湖
什么是数据湖数据湖（Data Lake）是一个用于存储大规模原始和未处理数据的存储系统。与传统的数据库和数据仓库不同，数据湖接受各种类型和格式的数据，包括结构化、半结构化和非结构化数据，而不需要对数据进行事先的转换或预处理。数据湖的目标是为数据科学家、分析师和其他数据使用者提供更灵活、可扩展且可访问的数据存储方式。数据湖是目前比较热的一个概念，许多企业都在构建或者计划构建自己的数据湖。但...

福州司马懿
发表于2023-08-28 18:12:58
3611 0 1

3.6k 0 1

什么是数据湖数据湖（Data Lake）是一个用于存储大规模原始和未处理数据的存储系统。与传统的数据库和数据仓库不同，数据湖接受各种类型和格式的数据，包括结构化、半结构化和非结构化数据，而不需要对数据进行事先的转换或预处理。数据湖的目标是为数据科学家、分析师和其他数据使用者提供更灵活、可扩展且可访问的数据存储方式。数据湖是目前比较热的一个概念，许多企业都在构建或者计划构建自己的数据湖。但...
Hadoop
大数据处理之高效查询频度排序
引言在互联网时代，数据量的爆炸增长给数据处理带来了巨大的挑战。本文将介绍如何高效地处理10个每个文件大小为1G的文件，其中每个文件的每一行存放的都是用户的查询(query)。我们的目标是按照查询的频度对这些查询进行排序。为了解决这个问题，我们将借助大数据处理技术，并给出代码示例。准备工作在开始之前，我们需要准备一些工具和环境：Hadoop：分布式计算框架，用于处理大规模数据。Hadoop...

赵KK日常技术记录
发表于2023-08-14 17:48:43
2218 0 0

2.2k 0 0

引言在互联网时代，数据量的爆炸增长给数据处理带来了巨大的挑战。本文将介绍如何高效地处理10个每个文件大小为1G的文件，其中每个文件的每一行存放的都是用户的查询(query)。我们的目标是按照查询的频度对这些查询进行排序。为了解决这个问题，我们将借助大数据处理技术，并给出代码示例。准备工作在开始之前，我们需要准备一些工具和环境：Hadoop：分布式计算框架，用于处理大规模数据。Hadoop...
AOP Hadoop Spring 大数据算法
【Hadoop】【Yarn】Yarn命令实现
【Hadoop】【Yarn】Yarn命令实现

沙漠里的果果酱
发表于2023-08-10 15:17:54
7872 0 0

7.8k 0 0

【Hadoop】【Yarn】Yarn命令实现
Hadoop Yarn
【Hadoop】【Yarn】ResourceManager中的web服务
【Hadoop】【Yarn】ResourceManager中的web服务

沙漠里的果果酱
发表于2023-08-10 11:38:39
8135 0 0

8.1k 0 0

【Hadoop】【Yarn】ResourceManager中的web服务
Hadoop Yarn
【Hadoop】【Yarn】Yarn的web 接口实现
【Hadoop】【Yarn】Yarn的web 接口实现

沙漠里的果果酱
发表于2023-08-10 11:34:45
7880 0 0

7.8k 0 0

【Hadoop】【Yarn】Yarn的web 接口实现
Hadoop Yarn
【Hadoop】【Yarn】Hadoop中ShutdownHook的使用
Hadoop中所有的进程的主线程都会被添加到ShutdownHook中。其作用是当进程的jvm退出可以让进程以一种比较优雅的方式退出。根据注册的shudownhook（线程）的顺序来决定以一种特定的顺序退出。下面是java doc中对shutdown hook官方解释。A shutdown hook is simply an initialized but unstarted thread....

沙漠里的果果酱
发表于2023-08-10 11:28:52
8459 0 0

8.4k 0 0

Hadoop中所有的进程的主线程都会被添加到ShutdownHook中。其作用是当进程的jvm退出可以让进程以一种比较优雅的方式退出。根据注册的shudownhook（线程）的顺序来决定以一种特定的顺序退出。下面是java doc中对shutdown hook官方解释。A shutdown hook is simply an initialized but unstarted thread....
Hadoop Yarn
【Hadoop】【Yarn】NodeManager启动源码分析
【Hadoop】【Yarn】NodeManager启动源码分析

沙漠里的果果酱
发表于2023-08-10 11:20:19
8376 0 0

8.3k 0 0

【Hadoop】【Yarn】NodeManager启动源码分析
Hadoop Yarn
【Hadoop】【Yarn】NodeManager中Container资源隔离
ContainerManagerImpl作为nodemanger中的一个Service，主要用来管理container的资源隔离。

沙漠里的果果酱
发表于2023-08-10 11:12:46
5393 0 0

5.3k 0 0

ContainerManagerImpl作为nodemanger中的一个Service，主要用来管理container的资源隔离。
Hadoop Yarn

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript