- flux是一个AI图像生成模型,它有120亿参数量,可以根据文字(英文)生成各种图片,也可以在图片里添加文字。本任务的主要目的是完成 flux 适配 Ascend 和 Kunpeng 处理器的开发与部署 flux是一个AI图像生成模型,它有120亿参数量,可以根据文字(英文)生成各种图片,也可以在图片里添加文字。本任务的主要目的是完成 flux 适配 Ascend 和 Kunpeng 处理器的开发与部署
- DeepSpeed 是由微软开发的深度学习训练优化库,专注于大规模分布式训练和推理加速。它的主要功能包括分布式训练、混合精度训练、内存优化(如 ZeRO 优化技术)以及模型压缩。本任务的主要目的是完成 DeepSpeed 适配 Ascend 和 Kunpeng 处理器的开发与部署 DeepSpeed 是由微软开发的深度学习训练优化库,专注于大规模分布式训练和推理加速。它的主要功能包括分布式训练、混合精度训练、内存优化(如 ZeRO 优化技术)以及模型压缩。本任务的主要目的是完成 DeepSpeed 适配 Ascend 和 Kunpeng 处理器的开发与部署
- 以动态调整灰度发布场景的治理规则为例来展示Backend是如何管理插件的动态配置的;《华为云DTSE》开源专刊发布,以开源促进技术创新和生态协同;分享如何在香橙派AI PRO(基于昇腾310B1芯片)上适配并运行通义千问大模型的完整流程... 以动态调整灰度发布场景的治理规则为例来展示Backend是如何管理插件的动态配置的;《华为云DTSE》开源专刊发布,以开源促进技术创新和生态协同;分享如何在香橙派AI PRO(基于昇腾310B1芯片)上适配并运行通义千问大模型的完整流程...
- 携手根生态使能开发者学习成长,云上技术创新。 携手根生态使能开发者学习成长,云上技术创新。
- 目前已经有越来越多的开发者使用Ascend C,我们将通过几期“Ascend C算子性能优化”专题分享,围绕开发者最为关心的算子性能优化环节,介绍Ascend C算子常用的优化技巧,帮助开发者自主构建出更优性能的算子。专题内容将围绕流水优化、搬运优化、内存优化、API使用优化以及Tiling优化等优化技巧,从方案讲解、优化案例、性能对比等多角度展开介绍。 目前已经有越来越多的开发者使用Ascend C,我们将通过几期“Ascend C算子性能优化”专题分享,围绕开发者最为关心的算子性能优化环节,介绍Ascend C算子常用的优化技巧,帮助开发者自主构建出更优性能的算子。专题内容将围绕流水优化、搬运优化、内存优化、API使用优化以及Tiling优化等优化技巧,从方案讲解、优化案例、性能对比等多角度展开介绍。
- 本案例以矩阵维度M = 4096,N = 5120,K = 4096,输入数据类型half,输出数据类型float,输出格式是ND为例,性能验证平台为Atlas A2训练系列产品/Atlas 800I A2推理产品,介绍针对Matmul算子的主要优化手段,包括优化分核逻辑、优化基本块、开启大包搬运。 本案例以矩阵维度M = 4096,N = 5120,K = 4096,输入数据类型half,输出数据类型float,输出格式是ND为例,性能验证平台为Atlas A2训练系列产品/Atlas 800I A2推理产品,介绍针对Matmul算子的主要优化手段,包括优化分核逻辑、优化基本块、开启大包搬运。
- 本文介绍了如何使用昇思MindSpore框架构建基于MNIST数据集的手写数字识别模型。首先,讲解了MindSpore的优势和架构。随后,详细描述了从数据下载、预处理到神经网络模型定义、训练和测试的完整流程。通过实例代码演示了如何使用MindSpore进行模型训练、保存和加载,并展示了模型预测的结果。最后,总结了学习过程中的重要经验和心得,鼓励读者动手实践,进一步探索和应用MindSpore。 本文介绍了如何使用昇思MindSpore框架构建基于MNIST数据集的手写数字识别模型。首先,讲解了MindSpore的优势和架构。随后,详细描述了从数据下载、预处理到神经网络模型定义、训练和测试的完整流程。通过实例代码演示了如何使用MindSpore进行模型训练、保存和加载,并展示了模型预测的结果。最后,总结了学习过程中的重要经验和心得,鼓励读者动手实践,进一步探索和应用MindSpore。
- 基于香橙派 AIpro搭建二维码分类模型及其Flask服务 🌴一.引言华为昇腾是华为在AI领域的核心品牌,提供先进的AI处理器和解决方案。其AI基础软硬件平台包含Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore等,为全球AI开发者提供强大的技术支持。随着物联网(IoT)和人工智能(AI)技术的飞速发展,边缘计算设备在数据处理和实时分析方面展现出巨大潜力。香橙... 基于香橙派 AIpro搭建二维码分类模型及其Flask服务 🌴一.引言华为昇腾是华为在AI领域的核心品牌,提供先进的AI处理器和解决方案。其AI基础软硬件平台包含Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore等,为全球AI开发者提供强大的技术支持。随着物联网(IoT)和人工智能(AI)技术的飞速发展,边缘计算设备在数据处理和实时分析方面展现出巨大潜力。香橙...
- 集合通信定义了一系列标准信息交换接口,解决并行计算时不同进程之间的通信问题。集合通信广泛用于AI、HPC等大规模计算通信场景。以深度学习数据并行训练场景为例,训练任务将不同训练样本分配给多个加速节点并行训练,在每一个训练迭代(或若干迭代)之后,模型梯度数据需要在所有节点间进行同步(如求和操作)。 集合通信定义了一系列标准信息交换接口,解决并行计算时不同进程之间的通信问题。集合通信广泛用于AI、HPC等大规模计算通信场景。以深度学习数据并行训练场景为例,训练任务将不同训练样本分配给多个加速节点并行训练,在每一个训练迭代(或若干迭代)之后,模型梯度数据需要在所有节点间进行同步(如求和操作)。
- 随着大模型的兴起,神经网络规模不断扩大,对内存资源的消耗也越来越高,如何降低AI算法的内存占用成为AI计算领域降成本提性能的一个重要手段。当前降低AI算法内存占用的主要技术有内存复用(Memory Reuse)、重算(Recompute)、内存交换(Memory Swap)、控制执行序(Topo优化)等,其中内存复用是应用最广泛的内存优化技术,该技术可在不影响网络执行性能的前提下降低内存占用,结合 随着大模型的兴起,神经网络规模不断扩大,对内存资源的消耗也越来越高,如何降低AI算法的内存占用成为AI计算领域降成本提性能的一个重要手段。当前降低AI算法内存占用的主要技术有内存复用(Memory Reuse)、重算(Recompute)、内存交换(Memory Swap)、控制执行序(Topo优化)等,其中内存复用是应用最广泛的内存优化技术,该技术可在不影响网络执行性能的前提下降低内存占用,结合
- 自昇腾Ascend C编程语言发布至今,已经有不少开发者通过官方教程文档、学习视频中快速掌握了如何开发Ascend C算子。然而对于一些深度开发者,需要更深入了解高性能编程技巧,更深层次理解编程模型和硬件架构、不同算子开发工程的区别以及高阶API的实现原理等。 自昇腾Ascend C编程语言发布至今,已经有不少开发者通过官方教程文档、学习视频中快速掌握了如何开发Ascend C算子。然而对于一些深度开发者,需要更深入了解高性能编程技巧,更深层次理解编程模型和硬件架构、不同算子开发工程的区别以及高阶API的实现原理等。
- 学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。 并打通一个Ascend910训练到Ascend310推理的全流程思路。 > 在本篇章,我们继续进入推理阶段! 学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。 并打通一个Ascend910训练到Ascend310推理的全流程思路。 > 在本篇章,我们继续进入推理阶段!
- CANN社区版从8.0RC1.alpha001开始,已经支持Atlas 200 A2推理产品进行Ascend C算子开发。据此,笔者在香橙派AIPro开发板上进行Ascend C环境搭建和例程运行。 CANN社区版从8.0RC1.alpha001开始,已经支持Atlas 200 A2推理产品进行Ascend C算子开发。据此,笔者在香橙派AIPro开发板上进行Ascend C环境搭建和例程运行。
- Orange Pi AI Pro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其搭载了昇腾 AI 处理器,可提供 8TOPS INT8 的计算能力,内存提供了 8GB 和 16GB两种版本。可以实现图像、视频等多种数据分析与推理计算,可广泛用于教育、机器人、无人机等场景。 Orange Pi AI Pro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其搭载了昇腾 AI 处理器,可提供 8TOPS INT8 的计算能力,内存提供了 8GB 和 16GB两种版本。可以实现图像、视频等多种数据分析与推理计算,可广泛用于教育、机器人、无人机等场景。
- DVPP(Digital Vision Pre-Processing)是昇腾AI处理器内置的图像处理单元,通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力,主要功能包括图像编解码、视频编解码、图像抠图缩放等。往期分享过几个DVPP视频解码问题的典型案例(单击Link查看),看的人多,说明在这一块,大家还是有些疑问的,所以本期继续分享其它DVPP视频解码问题的典型案例,并给出原... DVPP(Digital Vision Pre-Processing)是昇腾AI处理器内置的图像处理单元,通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力,主要功能包括图像编解码、视频编解码、图像抠图缩放等。往期分享过几个DVPP视频解码问题的典型案例(单击Link查看),看的人多,说明在这一块,大家还是有些疑问的,所以本期继续分享其它DVPP视频解码问题的典型案例,并给出原...
上滑加载中
推荐直播
-
计算机核心课程贯通式实践教学体系介绍
2025/01/05 周日 09:00-12:00
华为开发者布道师、湖南大学二级教授、博士生导师赵欢
1月5日上午,华为开发者布道师直播间将迎来重磅嘉宾!赵欢老师,计算机教育创新先锋,其 “小而全系统” 教学方案重塑计算机类专业课程与实践,融合鲲鹏生态技术知识,斩获国家级教学成果奖。杨科华老师专注小型全系统实践,在香橙派鲲鹏 Pro 开发板构建精妙 mini 系统,带您直击计算机底层奥秘。还有香橙派系统开发部李博经理,精通开发板硬件与应用,将全方位揭秘开发板使用及 FPGA 开发实战案例。三位大咖齐聚,为高校师生开启计算机系统能力提升的知识宝库,精彩即将上线,速速预约!
即将直播 -
GaussDB数据库介绍
2025/01/07 周二 16:00-18:00
Steven 华为云学堂技术讲师
本期直播将介绍GaussDB数据库的发展历程、优势、架构、关键特性和部署模式等,旨在帮助开发者了解GaussDB数据库,并通过手把手实验教大家如何在华为云部署GaussDB数据库和使用gsql连接GaussDB数据库。
去报名 -
DTT年度收官盛典:华为开发者空间大咖汇,共探云端开发创新
2025/01/08 周三 16:30-18:00
Yawei 华为云开发工具和效率首席专家 Edwin 华为开发者空间产品总监
数字化转型进程持续加速,驱动着技术革新发展,华为开发者空间如何巧妙整合鸿蒙、昇腾、鲲鹏等核心资源,打破平台间的壁垒,实现跨平台协同?在科技迅猛发展的今天,开发者们如何迅速把握机遇,实现高效、创新的技术突破?DTT 年度收官盛典,将与大家共同探索华为开发者空间的创新奥秘。
去报名
热门标签