- HBase基于PE工具读写性能测试 HBase基于PE工具读写性能测试
- 验证Topic单Partition单副本生产消费性能 验证Topic单Partition单副本生产消费性能
- 基于TestDFSIO工具的HDFS吞吐量性能测试 基于TestDFSIO工具的HDFS吞吐量性能测试
- 基于开源社区NNBench工具测试NameNode随机写性能 基于开源社区NNBench工具测试NameNode随机写性能
- Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight Hive Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight Hive
- Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight HDFS Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。 本文介绍Apache Drill安装以及对接FusionInsight HDFS
- 面向数字化转型中的政企客户,近年来,华为云大数据积极与世界同步,持续创新,致力于打造技术领先的数字底座,让大数据越用越快、越用越易、越用越稳、越用越省!把复杂留给自己,把简单留给伙伴,助力客户数字化转型成功! 面向数字化转型中的政企客户,近年来,华为云大数据积极与世界同步,持续创新,致力于打造技术领先的数字底座,让大数据越用越快、越用越易、越用越稳、越用越省!把复杂留给自己,把简单留给伙伴,助力客户数字化转型成功!
- 物化视图是一个预计算数据集,是大数据系统中最重要的查询性能调优工具之一,它允许用户预先连接复杂的视图和预计算摘要,以获得快速的响应时间。在CarbonData中,实例化视图通过执行相关查询投影、筛选器以及聚合和连接等昂贵操作的预计算,有助于提高性能。利用Carbon表上的实例化视图,我们可以避免不必要的大表全表扫描,从而加快查询速度。 物化视图助力Apache ... 物化视图是一个预计算数据集,是大数据系统中最重要的查询性能调优工具之一,它允许用户预先连接复杂的视图和预计算摘要,以获得快速的响应时间。在CarbonData中,实例化视图通过执行相关查询投影、筛选器以及聚合和连接等昂贵操作的预计算,有助于提高性能。利用Carbon表上的实例化视图,我们可以避免不必要的大表全表扫描,从而加快查询速度。 物化视图助力Apache ...
- 背景 我们已经看到,人们更热衷于高效可靠的解决方案,拥有为数据湖提供应对突变和事务处理的能力。在数据湖中,用户基于一组数据生成报告是非常常见的。随着各种类型的数据汇入数据湖,数据的状态不会一层不变。需要改变各种数据的用例包括随时间变化的时序数据、延迟到达的时延数据、平衡实时可用性和回填、状态变化的数据(如CDC)、数据快照、数据清理等,在生成报告时,这些都将被写入/更新在同一组... 背景 我们已经看到,人们更热衷于高效可靠的解决方案,拥有为数据湖提供应对突变和事务处理的能力。在数据湖中,用户基于一组数据生成报告是非常常见的。随着各种类型的数据汇入数据湖,数据的状态不会一层不变。需要改变各种数据的用例包括随时间变化的时序数据、延迟到达的时延数据、平衡实时可用性和回填、状态变化的数据(如CDC)、数据快照、数据清理等,在生成报告时,这些都将被写入/更新在同一组...
- 本文用于演示如何在FusionInsight HD中创建Hive自定义函数 本文用于演示如何在FusionInsight HD中创建Hive自定义函数
- 本文给出基于FusionInsight做离线数仓分析的案例 本文给出基于FusionInsight做离线数仓分析的案例
- 在河图中可以使用和开源presto一样的自定义UDF,本文用于指导如何使用自定义UDF 在河图中可以使用和开源presto一样的自定义UDF,本文用于指导如何使用自定义UDF
- 为了应对数据极速增长带来的多样性业务诉求,华为云CTO张宇昕在峰会上重磅发布了华为云FusionInsight新一代智能数据湖,通过一云一湖两引擎,使能数据治理和运营,释放海量数据价值。 为了应对数据极速增长带来的多样性业务诉求,华为云CTO张宇昕在峰会上重磅发布了华为云FusionInsight新一代智能数据湖,通过一云一湖两引擎,使能数据治理和运营,释放海量数据价值。
- Logstash是开源的服务器端数据处理管道,能够同时从多个来源采集数据,转换数据,然后将数据存储到Elasticsearch,如日志搜索场景等。本文介绍如何对接FusionInsight Elasticsearch。 Logstash是开源的服务器端数据处理管道,能够同时从多个来源采集数据,转换数据,然后将数据存储到Elasticsearch,如日志搜索场景等。本文介绍如何对接FusionInsight Elasticsearch。
- Kibana提供了图形化操作界面,通过可视化界面对Elasticsearch进行索引构建、查询、分析等操作。本文介绍如何对接FusionInsight Elasticsearch Kibana提供了图形化操作界面,通过可视化界面对Elasticsearch进行索引构建、查询、分析等操作。本文介绍如何对接FusionInsight Elasticsearch
上滑加载中
推荐直播
-
基于昇腾的皮肤病理多模态大模型研发
2025/06/05 周四 19:00-20:00
崔笑宇 华为开发者布道师-高校教师
本期直播聚焦昇腾AI平台在皮肤病理多模态大模型研发中的全流程技术突破,通过基于国产基座模型QwenV2.5进行微调,融入思维链数据优化推理能力,深度融合病理图像、临床文本及专家语音等多模态数据,构建覆盖“认知行为-逻辑推理-决策生成”全流程的皮肤病理大模型。
回顾中 -
云技术精髓入门级开发者认证考试辅导
2025/06/09 周一 16:00-17:30
大树 / 华为云学堂技术讲师
本次直播专为备考云技术精髓入门级开发者认证的学员设计,提供系统考试辅导。深度解析认证核心知识点,涵盖云技术基础概念、华为云基础设施与生态政策;详解计算、存储等华为云核心服务功能、场景及操作;解读云原生技术价值与转型要点。
回顾中
热门标签