- 验证Topic单Partition单副本生产消费性能 验证Topic单Partition单副本生产消费性能
- 基于TestDFSIO工具的HDFS吞吐量性能测试 基于TestDFSIO工具的HDFS吞吐量性能测试
- 基于开源社区NNBench工具测试NameNode随机写性能 基于开源社区NNBench工具测试NameNode随机写性能
- Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight Hive Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight Hive
- Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight HDFS Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight HDFS
- 面向数字化转型中的政企客户,近年来,华为云大数据积极与世界同步,持续创新,致力于打造技术领先的数字底座,让大数据越用越快、越用越易、越用越稳、越用越省!把复杂留给自己,把简单留给伙伴,助力客户数字化转型成功! 面向数字化转型中的政企客户,近年来,华为云大数据积极与世界同步,持续创新,致力于打造技术领先的数字底座,让大数据越用越快、越用越易、越用越稳、越用越省!把复杂留给自己,把简单留给伙伴,助力客户数字化转型成功!
- 物化视图是一个预计算数据集,是大数据系统中最重要的查询性能调优工具之一,它允许用户预先连接复杂的视图和预计算摘要,以获得快速的响应时间。在CarbonData中,实例化视图通过执行相关查询投影、筛选器以及聚合和连接等昂贵操作的预计算,有助于提高性能。利用Carbon表上的实例化视图,我们可以避免不必要的大表全表扫描,从而加快查询速度。 物化视图助力Apache ... 物化视图是一个预计算数据集,是大数据系统中最重要的查询性能调优工具之一,它允许用户预先连接复杂的视图和预计算摘要,以获得快速的响应时间。在CarbonData中,实例化视图通过执行相关查询投影、筛选器以及聚合和连接等昂贵操作的预计算,有助于提高性能。利用Carbon表上的实例化视图,我们可以避免不必要的大表全表扫描,从而加快查询速度。 物化视图助力Apache ...
- 背景 我们已经看到,人们更热衷于高效可靠的解决方案,拥有为数据湖提供应对突变和事务处理的能力。在数据湖中,用户基于一组数据生成报告是非常常见的。随着各种类型的数据汇入数据湖,数据的状态不会一层不变。需要改变各种数据的用例包括随时间变化的时序数据、延迟到达的时延数据、平衡实时可用性和回填、状态变化的数据(如CDC)、数据快照、数据清理等,在生成报告时,这些都将被写入/更新在同一组... 背景 我们已经看到,人们更热衷于高效可靠的解决方案,拥有为数据湖提供应对突变和事务处理的能力。在数据湖中,用户基于一组数据生成报告是非常常见的。随着各种类型的数据汇入数据湖,数据的状态不会一层不变。需要改变各种数据的用例包括随时间变化的时序数据、延迟到达的时延数据、平衡实时可用性和回填、状态变化的数据(如CDC)、数据快照、数据清理等,在生成报告时,这些都将被写入/更新在同一组...
- 本文用于演示如何在FusionInsight HD中创建Hive自定义函数 本文用于演示如何在FusionInsight HD中创建Hive自定义函数
- 本文给出基于FusionInsight做离线数仓分析的案例 本文给出基于FusionInsight做离线数仓分析的案例
- 在河图中可以使用和开源presto一样的自定义UDF,本文用于指导如何使用自定义UDF 在河图中可以使用和开源presto一样的自定义UDF,本文用于指导如何使用自定义UDF
- 为了应对数据极速增长带来的多样性业务诉求,华为云CTO张宇昕在峰会上重磅发布了华为云FusionInsight新一代智能数据湖,通过一云一湖两引擎,使能数据治理和运营,释放海量数据价值。 为了应对数据极速增长带来的多样性业务诉求,华为云CTO张宇昕在峰会上重磅发布了华为云FusionInsight新一代智能数据湖,通过一云一湖两引擎,使能数据治理和运营,释放海量数据价值。
- Logstash是开源的服务器端数据处理管道,能够同时从多个来源采集数据,转换数据,然后将数据存储到Elasticsearch,如日志搜索场景等。本文介绍如何对接FusionInsight Elasticsearch。 Logstash是开源的服务器端数据处理管道,能够同时从多个来源采集数据,转换数据,然后将数据存储到Elasticsearch,如日志搜索场景等。本文介绍如何对接FusionInsight Elasticsearch。
- Kibana提供了图形化操作界面,通过可视化界面对Elasticsearch进行索引构建、查询、分析等操作。本文介绍如何对接FusionInsight Elasticsearch Kibana提供了图形化操作界面,通过可视化界面对Elasticsearch进行索引构建、查询、分析等操作。本文介绍如何对接FusionInsight Elasticsearch
- dbeaver是免费和开源(GPL)为开发人员和数据库管理员通用数据库工具,本文介绍如何在Windows下使用DBeaver对接FusionInsight Hive dbeaver是免费和开源(GPL)为开发人员和数据库管理员通用数据库工具,本文介绍如何在Windows下使用DBeaver对接FusionInsight Hive
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考
2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本
2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签