- 开发者
- Atlas
#Atlas#
- 在上一篇《Atlas性能调优之瓶颈分析》中,主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 本文将详细描述使用Matrix框架的时候如何进行流程编排,搭建高性能应用。基本概念MatrixMatrix运行于操作系统之上,业务应用之下。屏蔽操作系统差异,为应用提供统一的标准化接口。Matrix具有多节点调度能力和多进程管理,... 在上一篇《Atlas性能调优之瓶颈分析》中,主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 本文将详细描述使用Matrix框架的时候如何进行流程编排,搭建高性能应用。基本概念MatrixMatrix运行于操作系统之上,业务应用之下。屏蔽操作系统差异,为应用提供统一的标准化接口。Matrix具有多节点调度能力和多进程管理,...
- Atlas人工智能计算平台,提供端、边、云的全场景AI解决方案,以强大的算力助力客户开启AI未来并加速企业智能化进程。为更好的发挥硬件算力,负载更多的业务流量,从今天开始将陆续推出性能分析、优化相关文章,助力用户在Atlas平台上进行软件开发、调优。本文主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 性能检查方法npu-... Atlas人工智能计算平台,提供端、边、云的全场景AI解决方案,以强大的算力助力客户开启AI未来并加速企业智能化进程。为更好的发挥硬件算力,负载更多的业务流量,从今天开始将陆续推出性能分析、优化相关文章,助力用户在Atlas平台上进行软件开发、调优。本文主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 性能检查方法npu-...
- 3月6日昇腾AI直播首秀,直播互动拿礼品! 3月6日昇腾AI直播首秀,直播互动拿礼品!
- 3月份昇腾直播大show,小伙伴们快来预约参与吧! 3月份昇腾直播大show,小伙伴们快来预约参与吧!
- 如何在Atlas 200 DK上编写(Python)并部署一个人脸识别应用?谭院长又来解惑啦! 如何在Atlas 200 DK上编写(Python)并部署一个人脸识别应用?谭院长又来解惑啦!
- 问题现象描述问题现象:在C30B896版本,安装完驱动后,使用npu-smi工具查询芯片,出现文件找不到情况,如下图:根本原因分析1、/lib64/目录下缺少npu-smi工具所依赖的动态链接库。结论、解决方案及效果结论:1、 如果执行npu-smi工具,提示“No such file or directory”,说明/lib64/目录下缺少ld-linux-aarch64.so.1文件,... 问题现象描述问题现象:在C30B896版本,安装完驱动后,使用npu-smi工具查询芯片,出现文件找不到情况,如下图:根本原因分析1、/lib64/目录下缺少npu-smi工具所依赖的动态链接库。结论、解决方案及效果结论:1、 如果执行npu-smi工具,提示“No such file or directory”,说明/lib64/目录下缺少ld-linux-aarch64.so.1文件,...
- 问题现象描述问题现象:用户在自制的Atlas200 SOC系统版上运行程序失败,在运行IDE-daemon-client命令时,发生错误,如下图所示:关键过程、根本原因分析关键过程:查看IDE-daemon-client的log信息,即查看/var/log/syslog,得到该命令的错误信息如下如所示:根据以上的错误信息,命令运行失败的原因是SSL握手失败,SSL握手失败的原因一般有:1.时... 问题现象描述问题现象:用户在自制的Atlas200 SOC系统版上运行程序失败,在运行IDE-daemon-client命令时,发生错误,如下图所示:关键过程、根本原因分析关键过程:查看IDE-daemon-client的log信息,即查看/var/log/syslog,得到该命令的错误信息如下如所示:根据以上的错误信息,命令运行失败的原因是SSL握手失败,SSL握手失败的原因一般有:1.时...
- 问题现象描述问题现象:模型输入数据尺寸是1000*128*7*7(NCHW),4个fc算子组成的网络模型,模型处理时延将近600ms。关键过程、根本原因分析关键过程:1. 为了测试模型推理时延,需要构造模型推理的工程,准备数据集和模型文件。2. 在程序里面进行打点处理,以便计算模型处理时延。图1-1 程序加点计算时延3. 打开日志查看模型处理时间,包括模型的数据输入、推理和数据输出耗时。4.... 问题现象描述问题现象:模型输入数据尺寸是1000*128*7*7(NCHW),4个fc算子组成的网络模型,模型处理时延将近600ms。关键过程、根本原因分析关键过程:1. 为了测试模型推理时延,需要构造模型推理的工程,准备数据集和模型文件。2. 在程序里面进行打点处理,以便计算模型处理时延。图1-1 程序加点计算时延3. 打开日志查看模型处理时间,包括模型的数据输入、推理和数据输出耗时。4....
- 问题现象描述问题现象:业务调试过程中,程序出现double free异常,日志报错如下:关键过程、根本原因分析关键过程:1、 使用HIAI_DMalloc接口为host侧的输入文件申请内存,如下所示: 2、 通过SendData函数发送数据结构体到device侧。3、 由于传入的buffer是智能指针,会自动释放一次内存。 4、 HIAI_DMalloc申请的... 问题现象描述问题现象:业务调试过程中,程序出现double free异常,日志报错如下:关键过程、根本原因分析关键过程:1、 使用HIAI_DMalloc接口为host侧的输入文件申请内存,如下所示: 2、 通过SendData函数发送数据结构体到device侧。3、 由于传入的buffer是智能指针,会自动释放一次内存。 4、 HIAI_DMalloc申请的...
- 2019年8月开始接触到华为Atlas方案,实验室之前一直以FPGA、DSP为主,从我进实验室后开始逐渐进行SoC的开发,包括Xilinx MPSoC、Hisilicon Hi3559A等方案。 2019年8月开始接触到华为Atlas方案,实验室之前一直以FPGA、DSP为主,从我进实验室后开始逐渐进行SoC的开发,包括Xilinx MPSoC、Hisilicon Hi3559A等方案。
- 数字视觉预处理模块作为昇腾AI软件栈中的编解码和图像转换模块,为神经网络发挥着预处理辅助功能。当来自系统内存和网络的视频或图像数据进入昇腾AI处理器的计算资源中运算之前,由于Davinci架构对输入数据有固定的格式要求,如果数据未满足架构规定的输入格式、分辨率等要求,就需要调用数字视觉处理模块进行格式的转换,才可以进行后续的神经网络计算步骤。功能架构数字视觉预处理对外提供6个模块,分别为视频... 数字视觉预处理模块作为昇腾AI软件栈中的编解码和图像转换模块,为神经网络发挥着预处理辅助功能。当来自系统内存和网络的视频或图像数据进入昇腾AI处理器的计算资源中运算之前,由于Davinci架构对输入数据有固定的格式要求,如果数据未满足架构规定的输入格式、分辨率等要求,就需要调用数字视觉处理模块进行格式的转换,才可以进行后续的神经网络计算步骤。功能架构数字视觉预处理对外提供6个模块,分别为视频...
- 功能简介昇腾AI处理器对网络执行层次进行划分,将特定功能的执行操作看做基本执行单位——计算引擎(Engine)。每个计算引擎在流程编排过程中对数据完成基本操作功能,如对图片进行分类处理、输入图片预处理及输出图片数据的标识等。计算引擎由开发者进行自定义来完成所需要的具体功能。通过流程编排器的统一调用,整个深度神经网络应用一般包括四个引擎:数据引擎,预处理引擎,模型推理引擎以及后处理引擎。数据引... 功能简介昇腾AI处理器对网络执行层次进行划分,将特定功能的执行操作看做基本执行单位——计算引擎(Engine)。每个计算引擎在流程编排过程中对数据完成基本操作功能,如对图片进行分类处理、输入图片预处理及输出图片数据的标识等。计算引擎由开发者进行自定义来完成所需要的具体功能。通过流程编排器的统一调用,整个深度神经网络应用一般包括四个引擎:数据引擎,预处理引擎,模型推理引擎以及后处理引擎。数据引...
- 为完成一个神经网络应用的实现和执行,昇腾AI软件栈在深度学习框架到昇腾AI处理器之间架起了一座桥梁,为神经网络从原始模型,到中间计算图表征,再到独立执行的离线模型提供了快速转化的捷径。昇腾AI软件栈围绕离线模型的生成、加载和执行,聚集了流程编排器、数字视觉预处理模块、张量加速引擎、框架管理器、运行管理器和任务调度器等功能块形成了一个完整的功能集群。流程编排器负责完成神经网络在昇腾AI处理器上... 为完成一个神经网络应用的实现和执行,昇腾AI软件栈在深度学习框架到昇腾AI处理器之间架起了一座桥梁,为神经网络从原始模型,到中间计算图表征,再到独立执行的离线模型提供了快速转化的捷径。昇腾AI软件栈围绕离线模型的生成、加载和执行,聚集了流程编排器、数字视觉预处理模块、张量加速引擎、框架管理器、运行管理器和任务调度器等功能块形成了一个完整的功能集群。流程编排器负责完成神经网络在昇腾AI处理器上...
- 昇腾AI软件栈提供了计算资源、性能调优的运行框架以及功能多样的配套工具,是一套完整的解决方案,可以使昇腾AI处理器发挥出极佳的性能。昇腾AI软件栈可以分为神经网络相关软件模块、工具链以及其它软件模块。· 神经网络软件主要包含了流程编排器(Matrix),框架管理器(Framework),运行管理器(Runtime)、数字视觉预处理模块(Digital Vision Pre-P... 昇腾AI软件栈提供了计算资源、性能调优的运行框架以及功能多样的配套工具,是一套完整的解决方案,可以使昇腾AI处理器发挥出极佳的性能。昇腾AI软件栈可以分为神经网络相关软件模块、工具链以及其它软件模块。· 神经网络软件主要包含了流程编排器(Matrix),框架管理器(Framework),运行管理器(Runtime)、数字视觉预处理模块(Digital Vision Pre-P...
- 背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索, 在接下来的系列文章中, 会陆续与读者们进行分享在此过程中踩过的坑和收获。1. Glossary(术语表) 介绍Atlas的术语表(Glossary)提供了一些适当的“单词”,这些“单词”能彼此进行关连和分类,以便业务用户在使用的时候,即使在不同的上下文中也能很好的理解它们。此外,这些术语也是可以映射到数据资产中的,比如:数据... 背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索, 在接下来的系列文章中, 会陆续与读者们进行分享在此过程中踩过的坑和收获。1. Glossary(术语表) 介绍Atlas的术语表(Glossary)提供了一些适当的“单词”,这些“单词”能彼此进行关连和分类,以便业务用户在使用的时候,即使在不同的上下文中也能很好的理解它们。此外,这些术语也是可以映射到数据资产中的,比如:数据...
上滑加载中
推荐直播
-
鸿蒙应用入门:轻松掌握ArkTS开发语言
2024/12/05 周四 16:00-18:00
Edi 华为云学堂技术讲师
本期直播课旨在让开发者了解ArkTS语法、轻松掌握ArkUI组件开发,带你零门槛入门鸿蒙开发,掌握状态管理实验和渲染控制实验。
回顾中 -
人工智能应用测试深度解析:理论基础与实践应用指南
2024/12/06 周五 14:30-16:30
Alex 华为云学堂技术讲师
本期直播主要结合理论及人工智能的相关实验,给大家讲述AI应用测试的主要流程和方法。帮助开发者了解AI应用测试的理论及方法,和AI应用测试在模型迭代调优过程中的作用。
去报名 -
2024 华为云开源开发者论坛 — 主论坛
2024/12/07 周六 09:00-12:00
华为及外部讲师团
2024年12月7日,首届华为云开源开发者论坛将于上海静安香格里拉酒店举行。论坛主题为“开放创新,释放云上数字生产力”,面向生态合作伙伴、企业、个人和高校开发者。论坛将围绕当前热门的开源话题,如“开源生态前景剖析”、“开源技术解读”、“开源开发者支持与实践”等进行分享和讨论,旨在帮助开发者利用开源链接鲲鹏、昇腾根生态和华为云生态,实现高效创新和价值裂变。
即将直播
热门标签