- 文章目录 一、复杂数据类型 二、数组类型(array)实战 (一)案例1、单列数组 1、创建文本文件array1.txt ... 文章目录 一、复杂数据类型 二、数组类型(array)实战 (一)案例1、单列数组 1、创建文本文件array1.txt ...
- 文章目录 一、初步了解Hive 1、Hadoop开发存在的问题 2、OLTP系统与OLAP系统 (1)OLTP - 在线... 文章目录 一、初步了解Hive 1、Hadoop开发存在的问题 2、OLTP系统与OLAP系统 (1)OLTP - 在线...
- 文章目录 一、Hive架构图 二、服务端组件 1、Driver组件 2、Metastore组件 3、Thrift服务 三、客户端... 文章目录 一、Hive架构图 二、服务端组件 1、Driver组件 2、Metastore组件 3、Thrift服务 三、客户端...
- 文章目录 一、汇聚去重函数:collect_set (一)案例1:单列数据去重 1、创建数据文件nums.txt 2... 文章目录 一、汇聚去重函数:collect_set (一)案例1:单列数据去重 1、创建数据文件nums.txt 2...
- 文章目录 一、Hive分桶表 1、分桶操作 2、分桶原理 3、注意事项 二、分桶表案例演示 1、创建数据文件c... 文章目录 一、Hive分桶表 1、分桶操作 2、分桶原理 3、注意事项 二、分桶表案例演示 1、创建数据文件c...
- 文章目录 一、字符串函数 1、字符串长度函数:length 2、字符串反转函数:reverse 案例:寻找表中回文字符串... 文章目录 一、字符串函数 1、字符串长度函数:length 2、字符串反转函数:reverse 案例:寻找表中回文字符串...
- 前言 随着 Flink 在流式计算的应用场景逐渐成熟和流行。如果 Flink 能同时把批量计算的应用场景处理好,就能减少用户在使用 Flink 的开发和维护成本,并且能够丰富 Flink 的生态。因为 SQL 是批计算比较常用的工具,所以 Flink 针对于批计算主要以 SQL 为主要接口。本次分享主要针对 Flink 对批处理的设计... 前言 随着 Flink 在流式计算的应用场景逐渐成熟和流行。如果 Flink 能同时把批量计算的应用场景处理好,就能减少用户在使用 Flink 的开发和维护成本,并且能够丰富 Flink 的生态。因为 SQL 是批计算比较常用的工具,所以 Flink 针对于批计算主要以 SQL 为主要接口。本次分享主要针对 Flink 对批处理的设计...
- 在分布式集群环境下,因为程序Bug(包括Hadoop本身的bug),负载不均衡或者资源分布不均等原因,会造成... 在分布式集群环境下,因为程序Bug(包括Hadoop本身的bug),负载不均衡或者资源分布不均等原因,会造成...
- 什么是Hive? Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。 2.HIve的意义(最初研发的原因) 减... 什么是Hive? Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。 2.HIve的意义(最初研发的原因) 减...
- Hive会将一个查询转化成一个或者多个阶段。这样的阶段可以是MapReduce阶段、抽样阶段、合并阶段、li... Hive会将一个查询转化成一个或者多个阶段。这样的阶段可以是MapReduce阶段、抽样阶段、合并阶段、li...
- Map数 <1>通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有:input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M,可在... Map数 <1>通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有:input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M,可在...
- 本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本... 本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本...
- JVM重用是Hadoop调优参数的内容,其对Hive的性能具有非常大的影响,特别是对于很难避免小文件的场景或... JVM重用是Hadoop调优参数的内容,其对Hive的性能具有非常大的影响,特别是对于很难避免小文件的场景或...
- 本篇博客,博主为大家介绍的是关于Kylin的增量构建的步骤过程,以及其与全量构建的差异对比!看完之后,相信你... 本篇博客,博主为大家介绍的是关于Kylin的增量构建的步骤过程,以及其与全量构建的差异对比!看完之后,相信你...
- 本篇博客小菌为大家带来的是关于Hive自定义函数的相关内容! &nbs... 本篇博客小菌为大家带来的是关于Hive自定义函数的相关内容! &nbs...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签