- 执行于AI Core上的指令队列主要包括如下几类,即:Vector指令队列(V)Matrix指令队列(M)存储移动指令队列(MTE2、MTE3)。不同指令队列间的相互独立性和可并行执行性,是double buffer优化机制的基石。矢量计算CopyIn、CopyOut过程使用存储移动指令队列(MTE2、MTE3),Compute过程使用Vector指令队列(V),意味着CopyIn、Copy... 执行于AI Core上的指令队列主要包括如下几类,即:Vector指令队列(V)Matrix指令队列(M)存储移动指令队列(MTE2、MTE3)。不同指令队列间的相互独立性和可并行执行性,是double buffer优化机制的基石。矢量计算CopyIn、CopyOut过程使用存储移动指令队列(MTE2、MTE3),Compute过程使用Vector指令队列(V),意味着CopyIn、Copy...
- 摘要本文将分享笔者在项目中应用华为昇腾AI处理器的使用感受和实践经验,探讨其在智能计算和深度学习领域的突出表现,并提供具体的操作流程和应用案例分析。 关键词华为昇腾AI、深度学习、智能计算、实践分享、案例分析作为一名人工智能和机器学习工程师,我在多个项目中体验了华为昇腾AI处理器的强大计算能力。昇腾AI处理器不仅提升了深度学习模型的训练效率,还显著优化了模型的推理速度。以下是我在项目中应用... 摘要本文将分享笔者在项目中应用华为昇腾AI处理器的使用感受和实践经验,探讨其在智能计算和深度学习领域的突出表现,并提供具体的操作流程和应用案例分析。 关键词华为昇腾AI、深度学习、智能计算、实践分享、案例分析作为一名人工智能和机器学习工程师,我在多个项目中体验了华为昇腾AI处理器的强大计算能力。昇腾AI处理器不仅提升了深度学习模型的训练效率,还显著优化了模型的推理速度。以下是我在项目中应用...
- 本文主要介绍了如何在昇腾上,使用pytorch对经典的图神经网络GraphSage在论文引用CiteSeer数据集上进行分类训练的实战讲解。内容包括GraphSage创新点分析、GraphSage算法原理、GraphSage网络架构剖析与GraphSage网络模型代码实战分析等等。 本文主要介绍了如何在昇腾上,使用pytorch对经典的图神经网络GraphSage在论文引用CiteSeer数据集上进行分类训练的实战讲解。内容包括GraphSage创新点分析、GraphSage算法原理、GraphSage网络架构剖析与GraphSage网络模型代码实战分析等等。
- HCCL集合通信课程全网首发!四节精讲课程助您快速入门 HCCL集合通信课程全网首发!四节精讲课程助您快速入门
- 1 背景介绍开源for Huawei(参考:https://developer.huaweicloud.cn/programs/opensource/contributing/) 通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下载 开... 1 背景介绍开源for Huawei(参考:https://developer.huaweicloud.cn/programs/opensource/contributing/) 通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下载 开...
- Fish-Speech是由Fish Audio团队开发的一款开源文本转语音(TTS)模型,旨在提供高质量、易用的语音合成解决方案。Fish-Speech基于深度学习技术,融合了VQGAN和LLAMA模型,能够生成接近真人发音的语音,并支持多种语音风格和效果,本文介绍了如何使用昇腾推理该模型。 Fish-Speech是由Fish Audio团队开发的一款开源文本转语音(TTS)模型,旨在提供高质量、易用的语音合成解决方案。Fish-Speech基于深度学习技术,融合了VQGAN和LLAMA模型,能够生成接近真人发音的语音,并支持多种语音风格和效果,本文介绍了如何使用昇腾推理该模型。
- BGE-M3是首个集多语言(Multi-Linguality)、多粒度(Multi-Granularity)、多功能(Multi-Functionality)三大技术特征于一体的语义向量模型, 本文介绍了如何使用昇腾推理该模型的方法 BGE-M3是首个集多语言(Multi-Linguality)、多粒度(Multi-Granularity)、多功能(Multi-Functionality)三大技术特征于一体的语义向量模型, 本文介绍了如何使用昇腾推理该模型的方法
- ViT是2020年Google团队提出的将Transformer应用在图像分类的模型,虽然不是第一篇将transformer应用在视觉任务的论文,但是因为其模型“简单”且效果好,可扩展性强,成为了transformer在CV领域应用的里程碑著作,本文介绍了如何使用昇腾 推理该模型。 ViT是2020年Google团队提出的将Transformer应用在图像分类的模型,虽然不是第一篇将transformer应用在视觉任务的论文,但是因为其模型“简单”且效果好,可扩展性强,成为了transformer在CV领域应用的里程碑著作,本文介绍了如何使用昇腾 推理该模型。
- CodeGeeX4-ALL-9B是最新的 CodeGeex 系列模型的开源版本,是由 THUDM 推出的全能开源多语言代码生成模型,该模型是在 Codegeex 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。 截至2024年11月122日,CodeGeeX4在GitHub上拥有1.5k的star和116的fork,有8名贡献者。最近一次代码提交时间为2024年11月19日。 CodeGeeX4-ALL-9B是最新的 CodeGeex 系列模型的开源版本,是由 THUDM 推出的全能开源多语言代码生成模型,该模型是在 Codegeex 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。 截至2024年11月122日,CodeGeeX4在GitHub上拥有1.5k的star和116的fork,有8名贡献者。最近一次代码提交时间为2024年11月19日。
- Llm_aided_ocr是一个基于LLM的OCR扫描PDF开源工具,旨在通过利用多模态大语言模型(LLM)将原始的OCR扫描PDF文本转换成高准确度、格式正确且易于阅读的Markdown文档。首先将PDF文件转图像,进行OCR扫描处理提取文本,再利用本地LLM或API(如OpenAI)纠正OCR错误,最后转换成高准确度、高质量的Markdown文本。 Llm_aided_ocr是一个基于LLM的OCR扫描PDF开源工具,旨在通过利用多模态大语言模型(LLM)将原始的OCR扫描PDF文本转换成高准确度、格式正确且易于阅读的Markdown文档。首先将PDF文件转图像,进行OCR扫描处理提取文本,再利用本地LLM或API(如OpenAI)纠正OCR错误,最后转换成高准确度、高质量的Markdown文本。
- 首先看了一下任务计划书:https://bbs.huaweicloud.cn/blogs/437788 ,主要目的是让mmcv能够在Ascend NPU和Kunpeng CPU上高效运行,确保项目在平台上具备良好的兼容性和性能,扩大其在AI和深度学习领域的竞争力和影响力。即验证mmcv能不能在 Ascend(昇腾)和 Kunpeng(鲲鹏)处理器中运行。 首先看了一下任务计划书:https://bbs.huaweicloud.cn/blogs/437788 ,主要目的是让mmcv能够在Ascend NPU和Kunpeng CPU上高效运行,确保项目在平台上具备良好的兼容性和性能,扩大其在AI和深度学习领域的竞争力和影响力。即验证mmcv能不能在 Ascend(昇腾)和 Kunpeng(鲲鹏)处理器中运行。
- Llama-factory适配昇腾开源验证任务心得根据任务计划书(https://bbs.huaweicloud.cn/blogs/437813)了解任务内容,主要目的是在昇腾npu上利用 Llama-factory完成一个大模型的训练推理,确保其在昇腾上能够正常运行。开发过程明确目的后开始熟悉框架,Llama-factory的github网址:https://github.com/hiy... Llama-factory适配昇腾开源验证任务心得根据任务计划书(https://bbs.huaweicloud.cn/blogs/437813)了解任务内容,主要目的是在昇腾npu上利用 Llama-factory完成一个大模型的训练推理,确保其在昇腾上能够正常运行。开发过程明确目的后开始熟悉框架,Llama-factory的github网址:https://github.com/hiy...
- CogVideoX是智谱AI开发的视频生成大模型。无需复杂的视频制作技能和工具,能够将简短的文本描述或静态图片转化为高质量、具有视觉吸引力的动态视频。本文将介绍在华为的Ascend NPU上配置CogVideoX项目的过程中遇到的问题和解决方案,以及心得总结。 CogVideoX是智谱AI开发的视频生成大模型。无需复杂的视频制作技能和工具,能够将简短的文本描述或静态图片转化为高质量、具有视觉吸引力的动态视频。本文将介绍在华为的Ascend NPU上配置CogVideoX项目的过程中遇到的问题和解决方案,以及心得总结。
- CodeGeeX4-ALL-9B是最新的 CodeGeeX4 系列模型的开源版本,是由 THUDM 推出的全能开源多语言代码生成模型,该模型是在 Codegeex 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。本文的主要目的是将Codegeex项目移植到华为的 Ascend NPU、Kunpeng CPU 以及 OpenEuler 操作系统上,确保其在这些平台上的性能优化和正常运行。 CodeGeeX4-ALL-9B是最新的 CodeGeeX4 系列模型的开源版本,是由 THUDM 推出的全能开源多语言代码生成模型,该模型是在 Codegeex 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。本文的主要目的是将Codegeex项目移植到华为的 Ascend NPU、Kunpeng CPU 以及 OpenEuler 操作系统上,确保其在这些平台上的性能优化和正常运行。
- Parler-TTS 是一个完全开源的文本到语音转换项目,本文是把该模型适配到昇腾npu并进行推理的心得以及操作过程 Parler-TTS 是一个完全开源的文本到语音转换项目,本文是把该模型适配到昇腾npu并进行推理的心得以及操作过程
上滑加载中
推荐直播
-
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day1)
2025/03/29 周六 09:00-18:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day2)
2025/03/30 周日 09:00-12:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
从AI基础到昇腾:大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30
不易 / 华为云学堂技术讲师
昇腾是华为研发的AI芯片,其具有哪些能力?我们如何基于其进行开发?本期直播将从AI以及大模型基础知识开始,介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区,旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
热门标签