- 华为技术专家分享有关于LLM lifelong learning的概念,帮助大家了解持续学习的特性与理论知识,同时也详细介绍了MoE的发展史。 华为技术专家分享有关于LLM lifelong learning的概念,帮助大家了解持续学习的特性与理论知识,同时也详细介绍了MoE的发展史。
- 目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大模型预训练+微调”开发范式即可在实际业务场景取得理想的效果。从经济成本和时间成本来看,预训练是构筑各种行业模型的主要部分,优化大模型预训练具有非常重要的意义。Open AI研究表明:大模型表现好坏强烈依赖于... 目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大模型预训练+微调”开发范式即可在实际业务场景取得理想的效果。从经济成本和时间成本来看,预训练是构筑各种行业模型的主要部分,优化大模型预训练具有非常重要的意义。Open AI研究表明:大模型表现好坏强烈依赖于...
- 在昇腾AI处理器上训练PyTorch框架模型时,可能由于算子在CPU上的下发速度、动态shape等问题,导致性能降低,那么本期就分享几个关于PyTorch模型调优的典型案例,给出调优思路及具体的调优方法。 在昇腾AI处理器上训练PyTorch框架模型时,可能由于算子在CPU上的下发速度、动态shape等问题,导致性能降低,那么本期就分享几个关于PyTorch模型调优的典型案例,给出调优思路及具体的调优方法。
- 华为云发布盘古大模型在矿山、政务、汽车、气象、医学、数字人、研发等领域的创新服务,并宣布华为云昇腾AI云服务正式上线,加快让千行万业实现大模型普惠,构建AI时代最佳云底座。 华为云发布盘古大模型在矿山、政务、汽车、气象、医学、数字人、研发等领域的创新服务,并宣布华为云昇腾AI云服务正式上线,加快让千行万业实现大模型普惠,构建AI时代最佳云底座。
- 介绍MindSpore常用的分布式并行训练技术,以及如何将并行技术应用到大模型预训练中。 介绍MindSpore常用的分布式并行训练技术,以及如何将并行技术应用到大模型预训练中。
- Ascend C提供孪生调试方法,即在cpu侧创建一个npu的模型并模拟它的计算行为,用来进行业务功能调试。相同的算子代码可以在cpu域调试精度,npu域调试性能。 Ascend C提供孪生调试方法,即在cpu侧创建一个npu的模型并模拟它的计算行为,用来进行业务功能调试。相同的算子代码可以在cpu域调试精度,npu域调试性能。
- 编程范式是算子实现的固定流程,基于Ascend C编程范式,可以快速搭建算子实现的代码框架。本文以一个实例为大家介绍如何基于Ascend C编程范式快速开发算子。 编程范式是算子实现的固定流程,基于Ascend C编程范式,可以快速搭建算子实现的代码框架。本文以一个实例为大家介绍如何基于Ascend C编程范式快速开发算子。
- Ascend C是华为昇腾面向算子开发场景的编程语言,想省时省力快速入门可以看这篇文章,为你系统化梳理AscendC编程最重要的知识点,3天快速上手不迷路。 Ascend C是华为昇腾面向算子开发场景的编程语言,想省时省力快速入门可以看这篇文章,为你系统化梳理AscendC编程最重要的知识点,3天快速上手不迷路。
- 前言最近我计划学习一下机器学习的相关技术,之前体验华为云CodeArts Snap的时候,重拾了一下Python。然后就信心满满的打开了Python机器学习的教程,发现比想象中的难。总觉得欠缺了些什么支撑自己的学习兴趣,正好最近在体验ModelArts,恍然大悟,缺少了些实践的乐趣。没有延迟的满足感,学习动力不足,得想办法充充电。之前一直做图片的训练和预测,这次得做点不一样的。突然想到了之前... 前言最近我计划学习一下机器学习的相关技术,之前体验华为云CodeArts Snap的时候,重拾了一下Python。然后就信心满满的打开了Python机器学习的教程,发现比想象中的难。总觉得欠缺了些什么支撑自己的学习兴趣,正好最近在体验ModelArts,恍然大悟,缺少了些实践的乐趣。没有延迟的满足感,学习动力不足,得想办法充充电。之前一直做图片的训练和预测,这次得做点不一样的。突然想到了之前...
- 前言最近公司食堂进行了升级,不但餐盘更换为智能餐盘,且结账的时候可以刷脸支付。这些升级让排队结账的速度提升了很多,且食堂员工效率也随之提高了很多。果然,科技改变世界。我观察了一下,智能餐盘基本没有卡顿,99%的准确率,偶尔有极少数识别不出来的情况。但是刷脸支付出现卡顿的情况相对多一些,主要是有遮挡的情况下,需要去掉遮挡。每次出现类似情况,需要食堂员工人工提醒。这种情况,我觉得还是不够智能。智... 前言最近公司食堂进行了升级,不但餐盘更换为智能餐盘,且结账的时候可以刷脸支付。这些升级让排队结账的速度提升了很多,且食堂员工效率也随之提高了很多。果然,科技改变世界。我观察了一下,智能餐盘基本没有卡顿,99%的准确率,偶尔有极少数识别不出来的情况。但是刷脸支付出现卡顿的情况相对多一些,主要是有遮挡的情况下,需要去掉遮挡。每次出现类似情况,需要食堂员工人工提醒。这种情况,我觉得还是不够智能。智...
- 前言最近家附近的好几块地,同时在进行房产开发建设,早晚都能看到建筑师傅们在忙碌。某天,夜跑中,发现前方的建筑工地,师傅们忙活的热火朝天,塔吊也在吊运钢筋中。准备绕路的时候,旁边负责安全是师傅热心的解释了一下。原来,早上钢筋运输过来,因为都是成捆成车来料,需要人工清点数量。由于数量较多,发现数量缺少时,再次调货,只能等晚上运来了。所以才有了前面那一幕。了解了事情的来龙去脉,我边跑边边思考,人工... 前言最近家附近的好几块地,同时在进行房产开发建设,早晚都能看到建筑师傅们在忙碌。某天,夜跑中,发现前方的建筑工地,师傅们忙活的热火朝天,塔吊也在吊运钢筋中。准备绕路的时候,旁边负责安全是师傅热心的解释了一下。原来,早上钢筋运输过来,因为都是成捆成车来料,需要人工清点数量。由于数量较多,发现数量缺少时,再次调货,只能等晚上运来了。所以才有了前面那一幕。了解了事情的来龙去脉,我边跑边边思考,人工...
- AI与大数据算法不断发展,在生产中的应用也越来越广,而应用的场景除了对算法,软件架构要求越来越高外,也对底层IaaS(基础设施即服务)提出了新的挑战。 AI与大数据算法不断发展,在生产中的应用也越来越广,而应用的场景除了对算法,软件架构要求越来越高外,也对底层IaaS(基础设施即服务)提出了新的挑战。
- 华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。 华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。
- 7月2日,北京金堤科技有限公司(即天眼查)与华为云共同发布新产品天眼可信商业助理——"天眼妹"。作为业界首个基于“可信数据+可信算法”的面向个人端的可控大模型数字产品,在由国家发展和改革委员会、工业和信息化部、科技部、国家网信办、商务部、中国科协联合北京市人民政府共同主办的全球数字经济大会人工智能高峰论坛上,“天眼妹”被授予“北京市通用人工智能大模型行业应用典型场景案例”称号。“聘请可靠的高... 7月2日,北京金堤科技有限公司(即天眼查)与华为云共同发布新产品天眼可信商业助理——"天眼妹"。作为业界首个基于“可信数据+可信算法”的面向个人端的可控大模型数字产品,在由国家发展和改革委员会、工业和信息化部、科技部、国家网信办、商务部、中国科协联合北京市人民政府共同主办的全球数字经济大会人工智能高峰论坛上,“天眼妹”被授予“北京市通用人工智能大模型行业应用典型场景案例”称号。“聘请可靠的高...
- 笔者最近发现在高性能8卡GPU的裸金属上的训练任务突然变慢,以前1个epoch约2小时执行完成,最近1个epoch需要2天才能执行完成。 并且执行nvidia-smi也明显变很卡顿。 笔者最近发现在高性能8卡GPU的裸金属上的训练任务突然变慢,以前1个epoch约2小时执行完成,最近1个epoch需要2天才能执行完成。 并且执行nvidia-smi也明显变很卡顿。
上滑加载中
推荐直播
-
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day1)
2025/03/29 周六 09:00-18:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day2)
2025/03/30 周日 09:00-12:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
从AI基础到昇腾:大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30
不易 / 华为云学堂技术讲师
昇腾是华为研发的AI芯片,其具有哪些能力?我们如何基于其进行开发?本期直播将从AI以及大模型基础知识开始,介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区,旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
热门标签