- 1.Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。 答:Spark具有如下4个主要特点: ①运行速度快;②容易使用;③通用性;④运行模式多样。  ... 1.Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。 答:Spark具有如下4个主要特点: ①运行速度快;②容易使用;③通用性;④运行模式多样。  ...
- 先让我们来回顾一下Spark的内置模块。 &nb... 先让我们来回顾一下Spark的内置模块。 &nb...
- 目录 Spark内核原理 RDD 依赖 窄依赖(Narrow Dependency) Shuffle 依赖(宽依赖 Wide Dependency) 如何区分宽窄依赖 DAG和Stage 词汇表 Spark内存迭代 所以,我们说Spark比MR效率高主要就是2个原... 目录 Spark内核原理 RDD 依赖 窄依赖(Narrow Dependency) Shuffle 依赖(宽依赖 Wide Dependency) 如何区分宽窄依赖 DAG和Stage 词汇表 Spark内存迭代 所以,我们说Spark比MR效率高主要就是2个原...
- 目录 SparkStreaming实战案例二 UpdateStateByKey 需求 1.updateStateByKey 2.mapWithState 代码实现 SparkStreaming实战案例二 UpdateStateByKey 需求 对从Socket接收的数据做WordCount并要求能够和历史数据进行累加!... 目录 SparkStreaming实战案例二 UpdateStateByKey 需求 1.updateStateByKey 2.mapWithState 代码实现 SparkStreaming实战案例二 UpdateStateByKey 需求 对从Socket接收的数据做WordCount并要求能够和历史数据进行累加!...
- 本篇博客是Spark之【RDD编程】系列第五篇,为大家介绍的是RDD依赖关系。 &... 本篇博客是Spark之【RDD编程】系列第五篇,为大家介绍的是RDD依赖关系。 &...
- 上一篇博客博主已经为大家介绍了Spark中数据读取与保存,这一篇博客则带来了Spark中的编程进阶。其中就涉... 上一篇博客博主已经为大家介绍了Spark中数据读取与保存,这一篇博客则带来了Spark中的编程进阶。其中就涉...
- 默认情况下,Spark程序运行完毕关闭窗口之后,就无法再查看运行记录的Web UI(4040)了,但通过 H... 默认情况下,Spark程序运行完毕关闭窗口之后,就无法再查看运行记录的Web UI(4040)了,但通过 H...
- 本篇博客,博主为大家介绍的是关于Spark中数据分区器的一些概念及使用讲解。 文章目录 键值对R... 本篇博客,博主为大家介绍的是关于Spark中数据分区器的一些概念及使用讲解。 文章目录 键值对R...
- 环境搭建-Standalone HA 高可用HA Spark Standalone集群是Master-Slaves架构的集群模式,和大部分的Master-Slaves结构集群一样,存在着Master单点故障(SPOF)的问题。 如何解决这个单点故障的问题,Spark提供了两种方案: 1.基于文件系统的单点恢复(Single-No... 环境搭建-Standalone HA 高可用HA Spark Standalone集群是Master-Slaves架构的集群模式,和大部分的Master-Slaves结构集群一样,存在着Master单点故障(SPOF)的问题。 如何解决这个单点故障的问题,Spark提供了两种方案: 1.基于文件系统的单点恢复(Single-No...
- 目录 Spark 框架模块-了解 Spark Core Spark SQL Spark Streaming Spark MLlib Spark GraphX Structured Streaming Spark 框架模块-了解 ... 目录 Spark 框架模块-了解 Spark Core Spark SQL Spark Streaming Spark MLlib Spark GraphX Structured Streaming Spark 框架模块-了解 ...
- 本篇博客,Alice为大家带来关于如何搭建Spark的on yarn集群模式的教程。 文章目录 ... 本篇博客,Alice为大家带来关于如何搭建Spark的on yarn集群模式的教程。 文章目录 ...
- 目录 环境搭建-Standalone 前言 Standalone 架构 集群规划 修改配置并分发 修改slaves 分发到其他机器 修改spark-env.sh 集群启动和停止 测试 环境搭建-Standalone Standalone模式是Spar... 目录 环境搭建-Standalone 前言 Standalone 架构 集群规划 修改配置并分发 修改slaves 分发到其他机器 修改spark-env.sh 集群启动和停止 测试 环境搭建-Standalone Standalone模式是Spar...
- 目录 环境搭建-Spark on YARN 注意事项 Spark On Yarn的本质? Spark On Yarn需要啥? 总结: 修改配置 修改spark-env.sh 整合历史服务器并关闭资源检查 整合Yarn历史服务器并关闭资源检查 配置spark历史服务器 修改spark-env.sh 设置日志级别 ... 目录 环境搭建-Spark on YARN 注意事项 Spark On Yarn的本质? Spark On Yarn需要啥? 总结: 修改配置 修改spark-env.sh 整合历史服务器并关闭资源检查 整合Yarn历史服务器并关闭资源检查 配置spark历史服务器 修改spark-env.sh 设置日志级别 ...
- 目录 RDD算子练习 map 算子 filter 算子 flatMap 算子 交集、并集、差集、笛卡尔积 distinct 算子 first、take、top 算子 keys、values 算子 mapValues 算子 ... 目录 RDD算子练习 map 算子 filter 算子 flatMap 算子 交集、并集、差集、笛卡尔积 distinct 算子 first、take、top 算子 keys、values 算子 mapValues 算子 ...
- 上一篇博客已经为大家介绍完了SparkSQL的基本概念以及其提供的两个编程抽象:DataFrame和Data... 上一篇博客已经为大家介绍完了SparkSQL的基本概念以及其提供的两个编程抽象:DataFrame和Data...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
苏州工业园区“华为云杯”2025人工智能应用创新大赛赛中直播
2025/08/21 周四 16:00-17:00
Vz 华为云AIoT技术布道师
本期直播将与您一起探讨如何基于华为云IoT平台全场景云服务,结合AI、鸿蒙、大数据等技术,打造有创新性,有竞争力的方案和产品。
即将直播
热门标签