- Hudi提供了MOR和COW两种存储模型,大数据原有的分区模型等,基于Hudi构建实时数据湖方案过程中,要根据对应的分析场景选择合适的存储模型,提升分析的性能、降低方案复杂度。 Hudi提供了MOR和COW两种存储模型,大数据原有的分区模型等,基于Hudi构建实时数据湖方案过程中,要根据对应的分析场景选择合适的存储模型,提升分析的性能、降低方案复杂度。
- 配置部署在线拍卖数据分析系统所需要的环境,然后把数据集上传到 HDFS 分布式文件系统,利用 Hive 对在线拍卖数据进行分析处理,并利用 Python对分析结果进行可视化展示-基于华为云MapReduce、ModelArts。 配置部署在线拍卖数据分析系统所需要的环境,然后把数据集上传到 HDFS 分布式文件系统,利用 Hive 对在线拍卖数据进行分析处理,并利用 Python对分析结果进行可视化展示-基于华为云MapReduce、ModelArts。
- 湖仓一体(LakeHouse)是一种新的开放式架构,它结合了数据湖和数据仓库的最佳元素,是当下大数据领域的重要发展方向。 华为湖仓一体架构核心基座是 Apache Hudi,所有入湖数据都通过 Apache Hudi 承载,对外通过 HetuEngine(Presto增强版)引擎承担一站式SQL分析角色,因此如何更好的结合 Presto 和 Hudi 使其查询效率接近专业的分布式数仓意义重大。 湖仓一体(LakeHouse)是一种新的开放式架构,它结合了数据湖和数据仓库的最佳元素,是当下大数据领域的重要发展方向。 华为湖仓一体架构核心基座是 Apache Hudi,所有入湖数据都通过 Apache Hudi 承载,对外通过 HetuEngine(Presto增强版)引擎承担一站式SQL分析角色,因此如何更好的结合 Presto 和 Hudi 使其查询效率接近专业的分布式数仓意义重大。
- 本期精彩看点:华为云诚邀广大开发者一起将代码送上太空,报名【华为开发者大赛·代码上太空赛道】,挑战500万元奖金池;数据治理生产线DataArts可以帮助企业解决数据智能化面临的挑战,让数据发挥价值... 本期精彩看点:华为云诚邀广大开发者一起将代码送上太空,报名【华为开发者大赛·代码上太空赛道】,挑战500万元奖金池;数据治理生产线DataArts可以帮助企业解决数据智能化面临的挑战,让数据发挥价值...
- 2022年6月15-16日,让我们一起线上相聚华为伙伴暨开发者大会2022,#勇往直前 做全能开发者# 大会精彩活动不容错过! 2022年6月15-16日,让我们一起线上相聚华为伙伴暨开发者大会2022,#勇往直前 做全能开发者# 大会精彩活动不容错过!
- 本期精彩看点:教你如何利用Python定制属于你的《本草纲目女孩》;通过引入FusionInsight RTD实时决策系统,实现医保费用的全流程管理;使用 Monaco Editor 做一个在线的网页代码编辑器。 本期精彩看点:教你如何利用Python定制属于你的《本草纲目女孩》;通过引入FusionInsight RTD实时决策系统,实现医保费用的全流程管理;使用 Monaco Editor 做一个在线的网页代码编辑器。
- 通过引入FusionInsight RTD实时决策系统,实现医保费用事前预防、事中控制、事后审核的全流程管理。从而将医保监管系统建设成既符合医保智能监管平台需求且具备未来信息化标准拓展能力,同时又能满足国家对智能监控的各项要求,最终实现先进的医保智能监管体系。 通过引入FusionInsight RTD实时决策系统,实现医保费用事前预防、事中控制、事后审核的全流程管理。从而将医保监管系统建设成既符合医保智能监管平台需求且具备未来信息化标准拓展能力,同时又能满足国家对智能监控的各项要求,最终实现先进的医保智能监管体系。
- 为了解决现阶段大数据存算分离痛点问题,华为云大数据推出重量级数据湖Catalog服务。 为了解决现阶段大数据存算分离痛点问题,华为云大数据推出重量级数据湖Catalog服务。
- 本文主要研究了hdfs文件系统的读写流程以及基于MRS在windows客户端下读写hdfs文件的实现 本文主要研究了hdfs文件系统的读写流程以及基于MRS在windows客户端下读写hdfs文件的实现
- 做项目时,需要将负责的服务部署到华为云的mrs上,这部分服务是用pyton开发,用到了mrs中的spark服务,现将部署过程记录一下,供大家参考。 做项目时,需要将负责的服务部署到华为云的mrs上,这部分服务是用pyton开发,用到了mrs中的spark服务,现将部署过程记录一下,供大家参考。
- Impala是一个MPP(大规模并行处理)SQL查询引擎, 提供类似RDBMS的体验,提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。 Impala是一个MPP(大规模并行处理)SQL查询引擎, 提供类似RDBMS的体验,提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。
- 近日,我们对TrinoDB开源社区近两年发布的版本进行了调研,基于1TB TPC-DS标准测试套的性能测试数据如下图:横坐标:TrinoDB社区版本号纵坐标:执行时长(越小越好) 针对Trino459相较于Trino 399版本的性能提升幅度,我们进一步深入分析后得到如下结论:生产场景性能提升 56%POC场景性能提升 46% 此外,当把测试数据集规模从1TB提升到10TB,观察到Trino... 近日,我们对TrinoDB开源社区近两年发布的版本进行了调研,基于1TB TPC-DS标准测试套的性能测试数据如下图:横坐标:TrinoDB社区版本号纵坐标:执行时长(越小越好) 针对Trino459相较于Trino 399版本的性能提升幅度,我们进一步深入分析后得到如下结论:生产场景性能提升 56%POC场景性能提升 46% 此外,当把测试数据集规模从1TB提升到10TB,观察到Trino...
- MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。我们可以使用官方文档提供API对MRS服务进行相关操作,如创建集群、删除集群、调整集群节点、创建作业并执行等。支持的全部操作可以参见官方文档API概览。但是如果基于文档去进行API的开发和调试,还是有一定的入门门槛, 依赖本地需要有API调用软件, 如果要开发代码还必须得有开发环境才能测试。例如创建集群的A... MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。我们可以使用官方文档提供API对MRS服务进行相关操作,如创建集群、删除集群、调整集群节点、创建作业并执行等。支持的全部操作可以参见官方文档API概览。但是如果基于文档去进行API的开发和调试,还是有一定的入门门槛, 依赖本地需要有API调用软件, 如果要开发代码还必须得有开发环境才能测试。例如创建集群的A...
- 近期工作上开始接触了大量容器化和华为云云容器引擎CCE的内容,因此整理学习了一堆有关容器化的知识,特此进行分享。在学习容器化之前,首先要了解一个内容,为什么要使用容器,好处是什么? 兼容性问题我们在工程实践中,经常会遇到一些兼容性的问题,比如:ISA兼容:目标机器指令集的兼容性ABI兼容:目标系统或者依赖库的二进制兼容性环境兼容: 目标环境的兼容性。例如环境变量、配置、注册中心等。以一个多服... 近期工作上开始接触了大量容器化和华为云云容器引擎CCE的内容,因此整理学习了一堆有关容器化的知识,特此进行分享。在学习容器化之前,首先要了解一个内容,为什么要使用容器,好处是什么? 兼容性问题我们在工程实践中,经常会遇到一些兼容性的问题,比如:ISA兼容:目标机器指令集的兼容性ABI兼容:目标系统或者依赖库的二进制兼容性环境兼容: 目标环境的兼容性。例如环境变量、配置、注册中心等。以一个多服...
- 华为FusionInsight MRS HBase的集群隔离——RSGroup一、HBase RSGroup理解 RSGroup是集群隔离方案。 HBase原有的资源隔离:为多个用户共享同一个HBase集群,提供了资源隔离的能力。NameSpace,将不同业务的表隔离在不同的namespace是一个最简单的资源隔离的方法。【轻量】ACL(Access Control Lists)... 华为FusionInsight MRS HBase的集群隔离——RSGroup一、HBase RSGroup理解 RSGroup是集群隔离方案。 HBase原有的资源隔离:为多个用户共享同一个HBase集群,提供了资源隔离的能力。NameSpace,将不同业务的表隔离在不同的namespace是一个最简单的资源隔离的方法。【轻量】ACL(Access Control Lists)...
上滑加载中
推荐直播
-
“智见未来”数字文旅创新大赛 线上培训
2025/04/16 周三 19:30-21:00
洪洁/行业算力发展部
4月16日19:30-21:00,大赛组委会将于线上举办培训,汇聚行业专家与技术大牛,从文旅产业的前沿趋势到AI技术的深度应用,全方位为你赋能
回顾中 -
WS63E星闪开发板快速入门指南:开启星闪技术之旅
2025/05/15 周四 19:00-20:30
杨阳 华为开发者布道师
本期直播,深度解析星闪技术核心优势与开发实战技巧,分享从环境搭建到“海思智棒”优秀星闪体验官案例开发的完整路径,覆盖技术原理、场景化案例、备赛避坑指南,助力开发者快速攻克物联网项目开发难题。
回顾中 -
星闪应用开发技术课程(群)建设思路与设想
2025/05/22 周四 19:00-21:00
葛非 华为开发者布道师
华中师范大学计算机学院副教授-葛非老师将深入讲解星闪核心技术及其支撑技术,并讨论如何将这些技术融入到通信工程、计算机科学与技术、软件工程等专业的课程内容中,旨在推动高等教育领域星闪鸿蒙生态的有序发展。
即将直播
热门标签