- 解锁昇腾算力:Ascend C算子开发中的多层接口抽象与自动并行计算技术🎯 昇腾CANN训练营报名信息2025年昇腾CANN训练营第二季报名链接: https://www.hiascend.com/developer/activities/cann20252#cann-camp-2502-intro 训练营简介: 2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入... 解锁昇腾算力:Ascend C算子开发中的多层接口抽象与自动并行计算技术🎯 昇腾CANN训练营报名信息2025年昇腾CANN训练营第二季报名链接: https://www.hiascend.com/developer/activities/cann20252#cann-camp-2502-intro 训练营简介: 2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入...
- 从理论到实践:深度解析昇腾CANN训练营中的Ascend C编程模型训练营简介2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。 获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机、平板、开发板等大奖。训练营报名链接: https://www.hia... 从理论到实践:深度解析昇腾CANN训练营中的Ascend C编程模型训练营简介2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。 获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机、平板、开发板等大奖。训练营报名链接: https://www.hia...
- 1 简介本文以 Ascend / CANN 的常见路径为例(官方文档常把“算子开发”分为:Ascend C(C/C++算子)、TBE(Tensor Boost Engine)算子、以及用 ATC 把单算子 JSON 编译成离线模型等)。步骤写成工程化 checklist,并附上简短示例/伪代码,方便上手参考。 2 CANN(Ascend)算子开发:典型流程(工程化步骤 + 示例)典型步骤(... 1 简介本文以 Ascend / CANN 的常见路径为例(官方文档常把“算子开发”分为:Ascend C(C/C++算子)、TBE(Tensor Boost Engine)算子、以及用 ATC 把单算子 JSON 编译成离线模型等)。步骤写成工程化 checklist,并附上简短示例/伪代码,方便上手参考。 2 CANN(Ascend)算子开发:典型流程(工程化步骤 + 示例)典型步骤(...
- 1 简介什么是CANN计算CANN(Compute Architecture for Neural Networks)?官方解释昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,包括昇腾系列处理器、系列硬件、CANN(Compute Architecture for Neural Networks,异构计算架构)、AI计算... 1 简介什么是CANN计算CANN(Compute Architecture for Neural Networks)?官方解释昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,包括昇腾系列处理器、系列硬件、CANN(Compute Architecture for Neural Networks,异构计算架构)、AI计算...
- 昇腾 NPU 在大模型推理中的性能和稳定性令人印象深刻,其硬件加速优势在实际任务中得到了充分验证。配合 GitCode 平台的云端开发环境,开发者能够轻松部署和测试大模型,享受快速、高效、安全的实验体验。无论是科研验证、教学演示还是轻量应用开发,这一组合都提供了强有力的技术支持,为国产 AI 算力生态的发展注入了活力与信心。 昇腾 NPU 在大模型推理中的性能和稳定性令人印象深刻,其硬件加速优势在实际任务中得到了充分验证。配合 GitCode 平台的云端开发环境,开发者能够轻松部署和测试大模型,享受快速、高效、安全的实验体验。无论是科研验证、教学演示还是轻量应用开发,这一组合都提供了强有力的技术支持,为国产 AI 算力生态的发展注入了活力与信心。
- 在实际部署中,可以通过多种策略进一步提升昇腾NPU910B的大模型推理效率。首先,Prompt 优化能够通过控制输入长度和复杂度显著提高吞吐量与响应速度。其次,采用 FP16 量化加载 可在显存受限的场景下有效降低资源占用,同时保持较高的推理性能。此外,结合 多轮生成与批量处理,配合异步调度或流水线机制,可以进一步提升大规模文本生成任务的整体效率。 在实际部署中,可以通过多种策略进一步提升昇腾NPU910B的大模型推理效率。首先,Prompt 优化能够通过控制输入长度和复杂度显著提高吞吐量与响应速度。其次,采用 FP16 量化加载 可在显存受限的场景下有效降低资源占用,同时保持较高的推理性能。此外,结合 多轮生成与批量处理,配合异步调度或流水线机制,可以进一步提升大规模文本生成任务的整体效率。
- 本次实践不仅验证了 Llama-2-7b 模型在国产昇腾平台上的可行性与稳定性,更重要的是展现了 中国自主AI算力体系已具备支持主流大模型落地的能力。这对于未来AI大模型的国产化训练与推理具有战略意义,也为科研机构和企业提供了可信赖的本土化替代路径。 本次实践不仅验证了 Llama-2-7b 模型在国产昇腾平台上的可行性与稳定性,更重要的是展现了 中国自主AI算力体系已具备支持主流大模型落地的能力。这对于未来AI大模型的国产化训练与推理具有战略意义,也为科研机构和企业提供了可信赖的本土化替代路径。
- 本文详细阐述了在OrangePi AI Studio Pro上基于昇腾310P使用MindYolo框架实现YOLOv8模型训练与验证的完整流程,涵盖环境准备、数据集格式转换、模型训练参数配置及性能评估。 本文详细阐述了在OrangePi AI Studio Pro上基于昇腾310P使用MindYolo框架实现YOLOv8模型训练与验证的完整流程,涵盖环境准备、数据集格式转换、模型训练参数配置及性能评估。
- 在AI模型运行过程中,通常需要CPU和AI专用处理器(如昇腾AI处理器)协同工作。CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。主机端擅长处理复杂的逻辑计算,而设备端擅长进行高并行计算。通过高效的计算调度机制,实现Host和Device之间的高效协同是提高AI模型性能的关键,能够显著提升异构系统资源的利用率。 在AI模型运行过程中,通常需要CPU和AI专用处理器(如昇腾AI处理器)协同工作。CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。主机端擅长处理复杂的逻辑计算,而设备端擅长进行高并行计算。通过高效的计算调度机制,实现Host和Device之间的高效协同是提高AI模型性能的关键,能够显著提升异构系统资源的利用率。
- 截至目前,华为云已将重大事故为零的记录连续保持了756天,“我们相信,安全、稳定、高质量、持续创新正是客户选择华为云的核心理由。”张平安说。 截至目前,华为云已将重大事故为零的记录连续保持了756天,“我们相信,安全、稳定、高质量、持续创新正是客户选择华为云的核心理由。”张平安说。
- 问: msopgen里面的-f选项有什么用?会生成什么文件呢?答: 在msopgen工具中,-f选项用于指定生成的算子工程框架类型。具体来说,-f aclnn表示生成的是简易自定义算子工程,该工程支持通过单算子API执行(aclnn)方式进行调用。使用这个选项时,生成的工程将包含算子host侧代码实现文件、kernel侧实现文件以及工程编译配置文件等,这些都是后续进行算子开发所必需的模板文件... 问: msopgen里面的-f选项有什么用?会生成什么文件呢?答: 在msopgen工具中,-f选项用于指定生成的算子工程框架类型。具体来说,-f aclnn表示生成的是简易自定义算子工程,该工程支持通过单算子API执行(aclnn)方式进行调用。使用这个选项时,生成的工程将包含算子host侧代码实现文件、kernel侧实现文件以及工程编译配置文件等,这些都是后续进行算子开发所必需的模板文件...
- 学好AscendC算子开发需要系统掌握昇腾NPU的体系架构和编程范式。在这个过程中,准确理解基础概念尤为重要,因为我们常常被学习课程中同一称谓的说法感到迷茫。一些名词在不同上下文环境中具有不同含义,这给初学者带来了不小的认知挑战。以"Block"这一概念为例,其具体含义会随着应用场景的变化而变化:在并行计算语境下,它指代AI Core的逻辑计算单元在数据切分时,它又代表单核计算所需的数据块大... 学好AscendC算子开发需要系统掌握昇腾NPU的体系架构和编程范式。在这个过程中,准确理解基础概念尤为重要,因为我们常常被学习课程中同一称谓的说法感到迷茫。一些名词在不同上下文环境中具有不同含义,这给初学者带来了不小的认知挑战。以"Block"这一概念为例,其具体含义会随着应用场景的变化而变化:在并行计算语境下,它指代AI Core的逻辑计算单元在数据切分时,它又代表单核计算所需的数据块大...
- 1、实验介绍1.1、实验平台介绍本实验详细描述了如何在华为开发者空间 AI NoteBook 上搭建昇腾 Ascend C 算子开发环境,并开发一个AddCustom 自定义算子。1.1.1、华为开发者空间简介华为开发者空间官网地址:https://developer.huaweicloud.cn/space 在华为开发者空间,每位注册的开发者都将享有年度内数百小时的云主机使用权,配备5G... 1、实验介绍1.1、实验平台介绍本实验详细描述了如何在华为开发者空间 AI NoteBook 上搭建昇腾 Ascend C 算子开发环境,并开发一个AddCustom 自定义算子。1.1.1、华为开发者空间简介华为开发者空间官网地址:https://developer.huaweicloud.cn/space 在华为开发者空间,每位注册的开发者都将享有年度内数百小时的云主机使用权,配备5G...
- 昇腾迁移逻辑图 昇腾迁移逻辑图
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签