- 操作场景: Flume消费kafka数据存储到HBase中。前提条件: 已创建混合集群或者流式和分析集群(集群间网络互通,如果开启kerberos,则需配置跨集群互信https://support.huaweicloud.cn/usermanual-mrs/mrs_01_0354.html)。操作步骤: 1. 从HBase客户端拷贝配置文件hbase-site.xml到F... 操作场景: Flume消费kafka数据存储到HBase中。前提条件: 已创建混合集群或者流式和分析集群(集群间网络互通,如果开启kerberos,则需配置跨集群互信https://support.huaweicloud.cn/usermanual-mrs/mrs_01_0354.html)。操作步骤: 1. 从HBase客户端拷贝配置文件hbase-site.xml到F...
- 本文将介绍如何通过在Linux的机器上,执行kettle脚本,在MRS集群中,运行Spark程序。 本文将介绍如何通过在Linux的机器上,执行kettle脚本,在MRS集群中,运行Spark程序。
- 如果我们安装了python3.7版本来运行spark,并且用到了RDD的take函数,就会报错:RuntimeError: generator raised StopIteration。本文介绍了问题的原因和处理方法。 如果我们安装了python3.7版本来运行spark,并且用到了RDD的take函数,就会报错:RuntimeError: generator raised StopIteration。本文介绍了问题的原因和处理方法。
- 如果能配合jupyter notebook使用pyspark,无论是机器学习,数据探索,还是ETL应用的开发,开发效率直接起飞。本文就来介绍配合jupyter notebook来使用pyspark。 如果能配合jupyter notebook使用pyspark,无论是机器学习,数据探索,还是ETL应用的开发,开发效率直接起飞。本文就来介绍配合jupyter notebook来使用pyspark。
- 使用python3运行pyspark,需要做两步:1. 在mrs集群的所有core节点,以及提交任务的节点(通常为mrs的master节点),均安装python3;2. 指定pyspark使用的python路径。 使用python3运行pyspark,需要做两步:1. 在mrs集群的所有core节点,以及提交任务的节点(通常为mrs的master节点),均安装python3;2. 指定pyspark使用的python路径。
- MRS服务的ECS对用户开放,但是都是内网地址,用户访问十分困难,给调试带来很多不便,故该本文提供在ECS上搭建vpn服务,通过本地连接vpn,进而可以利用一个弹性ip即可访问整个MRS服务内的所有节点,为用户开发者在MRS服务进行业务开发提供访问便利。本文提供两种方法搭建vpn,开源代码见附件,也可自行在github下载。 MRS服务的ECS对用户开放,但是都是内网地址,用户访问十分困难,给调试带来很多不便,故该本文提供在ECS上搭建vpn服务,通过本地连接vpn,进而可以利用一个弹性ip即可访问整个MRS服务内的所有节点,为用户开发者在MRS服务进行业务开发提供访问便利。本文提供两种方法搭建vpn,开源代码见附件,也可自行在github下载。
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
苏州工业园区“华为云杯”2025人工智能应用创新大赛赛中直播
2025/08/21 周四 16:00-17:00
Vz 华为云AIoT技术布道师
本期直播将与您一起探讨如何基于华为云IoT平台全场景云服务,结合AI、鸿蒙、大数据等技术,打造有创新性,有竞争力的方案和产品。
即将直播
热门标签