- 绑核优化推理性能 绑核优化推理性能
- HCCL(Huawei Collective Communication Library)是基于昇腾AI处理器的高性能集合通信库,提供单机多卡以及多机多卡间的集合通信能力,支持大模型的数据并行、模型并行、专家并行、pipeline并行、序列并行等多种加速方案。 HCCL(Huawei Collective Communication Library)是基于昇腾AI处理器的高性能集合通信库,提供单机多卡以及多机多卡间的集合通信能力,支持大模型的数据并行、模型并行、专家并行、pipeline并行、序列并行等多种加速方案。
- 扫码关注【昇腾CANN】视频号快速预约直播,填写问卷在线收集问题并解答!B站观看链接:https://live.bilibili.com/h5/23361884 昇腾社区观看链接:https://www.hiascend.com/developer/cann20241 问卷链接:https://www.hiascend.com/zh/forms/shendukaifang?from=S0 扫码关注【昇腾CANN】视频号快速预约直播,填写问卷在线收集问题并解答!B站观看链接:https://live.bilibili.com/h5/23361884 昇腾社区观看链接:https://www.hiascend.com/developer/cann20241 问卷链接:https://www.hiascend.com/zh/forms/shendukaifang?from=S0
- 本文以PaddleOCR的模型推理为例,介绍如何将PaddleOCR模型的推理迁移至ModelArts的昇腾环境上,并部署成AI应用和在线服务。 本文以PaddleOCR的模型推理为例,介绍如何将PaddleOCR模型的推理迁移至ModelArts的昇腾环境上,并部署成AI应用和在线服务。
- 昇腾算子开发和应用开发环境配置 昇腾算子开发和应用开发环境配置
- 在昇腾裸金属服务器中,启动容器挂载XPU卡,容器创建成功,但是执行Npu-smi报错显示8020. 在昇腾裸金属服务器中,启动容器挂载XPU卡,容器创建成功,但是执行Npu-smi报错显示8020.
- 华为CANN训练营昇腾训练执行与推理部署系列课程笔记一、课程介绍本次华为CANN训练营昇腾训练执行与推理部署系列课程旨在提供全面的指导和实践,让学员能够深入了解昇腾AI处理器的工作原理,并熟练掌握在CANN(Compute Architecture for Neural Networks)框架下进行深度学习模型的训练执行和推理部署。二、昇腾AI处理器与CANN概述昇腾AI处理器:华为自主研发... 华为CANN训练营昇腾训练执行与推理部署系列课程笔记一、课程介绍本次华为CANN训练营昇腾训练执行与推理部署系列课程旨在提供全面的指导和实践,让学员能够深入了解昇腾AI处理器的工作原理,并熟练掌握在CANN(Compute Architecture for Neural Networks)框架下进行深度学习模型的训练执行和推理部署。二、昇腾AI处理器与CANN概述昇腾AI处理器:华为自主研发...
- 【CANN训练营笔记】Atlas 200I DK A2体验手写数字识别模型训练&推理 【CANN训练营笔记】Atlas 200I DK A2体验手写数字识别模型训练&推理
- 海思Hi3516DV500部署paddle的版型分析模型记录,包含了python版本以及c++版本的部署,同时根据需要制作自己的数据集并重新训练达到理想效果 海思Hi3516DV500部署paddle的版型分析模型记录,包含了python版本以及c++版本的部署,同时根据需要制作自己的数据集并重新训练达到理想效果
- Ascend Snt9B服务器上HCCL_TEST profiling工具使用 Ascend Snt9B服务器上HCCL_TEST profiling工具使用
- 本文旨指导在华为云Ascend Snt9B裸金属服务器上进行 RoCE网卡带宽测试 本文旨指导在华为云Ascend Snt9B裸金属服务器上进行 RoCE网卡带宽测试
- 昇腾为使用PyTorch框架的开发者提供昇腾昇腾AI处理器的超强算力,需要安装PyTorch Adapter插件用于适配PyTorch,本文提供了解决方案指导用户安装Pytorch框架和Pytorch Adapter插件。 昇腾为使用PyTorch框架的开发者提供昇腾昇腾AI处理器的超强算力,需要安装PyTorch Adapter插件用于适配PyTorch,本文提供了解决方案指导用户安装Pytorch框架和Pytorch Adapter插件。
- 华为云NPU驱动固件包商用版本周期性的发布。 本文给出驱动固件新版本的升级方案。 华为云NPU驱动固件包商用版本周期性的发布。 本文给出驱动固件新版本的升级方案。
- 1. 问题描述使用华为云Snt9B裸金属服务器,通过nohup命令基于pytorch框架进行大模型训练时,训练中途偶现如下报错导致训练中断:{'loss': 0.0759, 'learning_rate': 0.0005298913043478261, 'epoch': 3.15} 79%|███████▉ | 4640/5888 [2:28:56<5:39:33, 16.32s/it] ... 1. 问题描述使用华为云Snt9B裸金属服务器,通过nohup命令基于pytorch框架进行大模型训练时,训练中途偶现如下报错导致训练中断:{'loss': 0.0759, 'learning_rate': 0.0005298913043478261, 'epoch': 3.15} 79%|███████▉ | 4640/5888 [2:28:56<5:39:33, 16.32s/it] ...
- 1. 问题描述使用华为云昇腾Snt9B裸金属服务器,基于pytorch框架进行大模型训练时,需要迭代训练100轮,在第21轮训练时中途报错:RuntimeError: [enforce fail at inline_container.cc:471] . PytorchStreamWriter failed writing file data: file write failed具体报错信息... 1. 问题描述使用华为云昇腾Snt9B裸金属服务器,基于pytorch框架进行大模型训练时,需要迭代训练100轮,在第21轮训练时中途报错:RuntimeError: [enforce fail at inline_container.cc:471] . PytorchStreamWriter failed writing file data: file write failed具体报错信息...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
苏州工业园区“华为云杯”2025人工智能应用创新大赛赛中直播
2025/08/21 周四 16:00-17:00
Vz 华为云AIoT技术布道师
本期直播将与您一起探讨如何基于华为云IoT平台全场景云服务,结合AI、鸿蒙、大数据等技术,打造有创新性,有竞争力的方案和产品。
回顾中 -
深入解读架构师专业级培训认证
2025/08/22 周五 16:30-17:30
阿肯-华为云生态技术讲师
解决方案架构专业级是开发者认证中的顶端明珠。这门认证聊什么?值得学吗?怎么考、考什么、难不难?这门课程深入解答
回顾中
热门标签