- 语言模型目标是建模自然语言的概率分布,在自然语言处理研究中具有重要的作用,是自然语言处理基础任务之一。大量的研究从n 元语言模型(n-gram Language Models)、神经语言模型(Neural Language Models,NLM)以及预训练语言模型(Pre-trained Language Models,PLM)等不同角度开展了系列工作。这些研究在不同阶段都对自然语... 语言模型目标是建模自然语言的概率分布,在自然语言处理研究中具有重要的作用,是自然语言处理基础任务之一。大量的研究从n 元语言模型(n-gram Language Models)、神经语言模型(Neural Language Models,NLM)以及预训练语言模型(Pre-trained Language Models,PLM)等不同角度开展了系列工作。这些研究在不同阶段都对自然语...
- 深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测方法与计算成本的关系。具体来说,尽管深度学习方法在日志异常检测方面取得了出色的性能,但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断,从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究... 深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测方法与计算成本的关系。具体来说,尽管深度学习方法在日志异常检测方面取得了出色的性能,但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断,从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究...
- 本文主要介绍了一个名为CoderEval的代码生成大模型评估基准,并对三个代码生成模型(CodeGen、PanGu-Coder和ChatGPT)在该基准上的表现进行了评估和比较。研究人员从真实的开源项目中的选取了代码生成任务来构建CoderEval,并根据对外部依赖的程度为标准将这些任务分为6个等级、根据生成的目标分为3类生成任务,以更多维地评估不同大模型在不同上下文场景中的生成效果。实验结... 本文主要介绍了一个名为CoderEval的代码生成大模型评估基准,并对三个代码生成模型(CodeGen、PanGu-Coder和ChatGPT)在该基准上的表现进行了评估和比较。研究人员从真实的开源项目中的选取了代码生成任务来构建CoderEval,并根据对外部依赖的程度为标准将这些任务分为6个等级、根据生成的目标分为3类生成任务,以更多维地评估不同大模型在不同上下文场景中的生成效果。实验结...
- 随着人工智能的快速发展,越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成两个关键部分,一个是训练数据预处理,一个是模型训练,如何提升两者的处理性能成为提升模型训练性能的关键。一般情况下,数据加载预处理由host CPU处理,而模型训练计算是在NPU或GPU上处理的,两者一般并行执行,因此训练一次迭代的时间通常是两个处理时间的最大值。 随着人工智能的快速发展,越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成两个关键部分,一个是训练数据预处理,一个是模型训练,如何提升两者的处理性能成为提升模型训练性能的关键。一般情况下,数据加载预处理由host CPU处理,而模型训练计算是在NPU或GPU上处理的,两者一般并行执行,因此训练一次迭代的时间通常是两个处理时间的最大值。
- 华为技术专家分享有关于LLM lifelong learning的概念,帮助大家了解持续学习的特性与理论知识,同时也详细介绍了MoE的发展史。 华为技术专家分享有关于LLM lifelong learning的概念,帮助大家了解持续学习的特性与理论知识,同时也详细介绍了MoE的发展史。
- 目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大模型预训练+微调”开发范式即可在实际业务场景取得理想的效果。从经济成本和时间成本来看,预训练是构筑各种行业模型的主要部分,优化大模型预训练具有非常重要的意义。Open AI研究表明:大模型表现好坏强烈依赖于... 目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大模型预训练+微调”开发范式即可在实际业务场景取得理想的效果。从经济成本和时间成本来看,预训练是构筑各种行业模型的主要部分,优化大模型预训练具有非常重要的意义。Open AI研究表明:大模型表现好坏强烈依赖于...
- 在昇腾AI处理器上训练PyTorch框架模型时,可能由于算子在CPU上的下发速度、动态shape等问题,导致性能降低,那么本期就分享几个关于PyTorch模型调优的典型案例,给出调优思路及具体的调优方法。 在昇腾AI处理器上训练PyTorch框架模型时,可能由于算子在CPU上的下发速度、动态shape等问题,导致性能降低,那么本期就分享几个关于PyTorch模型调优的典型案例,给出调优思路及具体的调优方法。
- 华为云发布盘古大模型在矿山、政务、汽车、气象、医学、数字人、研发等领域的创新服务,并宣布华为云昇腾AI云服务正式上线,加快让千行万业实现大模型普惠,构建AI时代最佳云底座。 华为云发布盘古大模型在矿山、政务、汽车、气象、医学、数字人、研发等领域的创新服务,并宣布华为云昇腾AI云服务正式上线,加快让千行万业实现大模型普惠,构建AI时代最佳云底座。
- 介绍MindSpore常用的分布式并行训练技术,以及如何将并行技术应用到大模型预训练中。 介绍MindSpore常用的分布式并行训练技术,以及如何将并行技术应用到大模型预训练中。
- Ascend C提供孪生调试方法,即在cpu侧创建一个npu的模型并模拟它的计算行为,用来进行业务功能调试。相同的算子代码可以在cpu域调试精度,npu域调试性能。 Ascend C提供孪生调试方法,即在cpu侧创建一个npu的模型并模拟它的计算行为,用来进行业务功能调试。相同的算子代码可以在cpu域调试精度,npu域调试性能。
- 编程范式是算子实现的固定流程,基于Ascend C编程范式,可以快速搭建算子实现的代码框架。本文以一个实例为大家介绍如何基于Ascend C编程范式快速开发算子。 编程范式是算子实现的固定流程,基于Ascend C编程范式,可以快速搭建算子实现的代码框架。本文以一个实例为大家介绍如何基于Ascend C编程范式快速开发算子。
- Ascend C是华为昇腾面向算子开发场景的编程语言,想省时省力快速入门可以看这篇文章,为你系统化梳理AscendC编程最重要的知识点,3天快速上手不迷路。 Ascend C是华为昇腾面向算子开发场景的编程语言,想省时省力快速入门可以看这篇文章,为你系统化梳理AscendC编程最重要的知识点,3天快速上手不迷路。
- 前言最近我计划学习一下机器学习的相关技术,之前体验华为云CodeArts Snap的时候,重拾了一下Python。然后就信心满满的打开了Python机器学习的教程,发现比想象中的难。总觉得欠缺了些什么支撑自己的学习兴趣,正好最近在体验ModelArts,恍然大悟,缺少了些实践的乐趣。没有延迟的满足感,学习动力不足,得想办法充充电。之前一直做图片的训练和预测,这次得做点不一样的。突然想到了之前... 前言最近我计划学习一下机器学习的相关技术,之前体验华为云CodeArts Snap的时候,重拾了一下Python。然后就信心满满的打开了Python机器学习的教程,发现比想象中的难。总觉得欠缺了些什么支撑自己的学习兴趣,正好最近在体验ModelArts,恍然大悟,缺少了些实践的乐趣。没有延迟的满足感,学习动力不足,得想办法充充电。之前一直做图片的训练和预测,这次得做点不一样的。突然想到了之前...
- 前言最近公司食堂进行了升级,不但餐盘更换为智能餐盘,且结账的时候可以刷脸支付。这些升级让排队结账的速度提升了很多,且食堂员工效率也随之提高了很多。果然,科技改变世界。我观察了一下,智能餐盘基本没有卡顿,99%的准确率,偶尔有极少数识别不出来的情况。但是刷脸支付出现卡顿的情况相对多一些,主要是有遮挡的情况下,需要去掉遮挡。每次出现类似情况,需要食堂员工人工提醒。这种情况,我觉得还是不够智能。智... 前言最近公司食堂进行了升级,不但餐盘更换为智能餐盘,且结账的时候可以刷脸支付。这些升级让排队结账的速度提升了很多,且食堂员工效率也随之提高了很多。果然,科技改变世界。我观察了一下,智能餐盘基本没有卡顿,99%的准确率,偶尔有极少数识别不出来的情况。但是刷脸支付出现卡顿的情况相对多一些,主要是有遮挡的情况下,需要去掉遮挡。每次出现类似情况,需要食堂员工人工提醒。这种情况,我觉得还是不够智能。智...
- 前言最近家附近的好几块地,同时在进行房产开发建设,早晚都能看到建筑师傅们在忙碌。某天,夜跑中,发现前方的建筑工地,师傅们忙活的热火朝天,塔吊也在吊运钢筋中。准备绕路的时候,旁边负责安全是师傅热心的解释了一下。原来,早上钢筋运输过来,因为都是成捆成车来料,需要人工清点数量。由于数量较多,发现数量缺少时,再次调货,只能等晚上运来了。所以才有了前面那一幕。了解了事情的来龙去脉,我边跑边边思考,人工... 前言最近家附近的好几块地,同时在进行房产开发建设,早晚都能看到建筑师傅们在忙碌。某天,夜跑中,发现前方的建筑工地,师傅们忙活的热火朝天,塔吊也在吊运钢筋中。准备绕路的时候,旁边负责安全是师傅热心的解释了一下。原来,早上钢筋运输过来,因为都是成捆成车来料,需要人工清点数量。由于数量较多,发现数量缺少时,再次调货,只能等晚上运来了。所以才有了前面那一幕。了解了事情的来龙去脉,我边跑边边思考,人工...
上滑加载中
推荐直播
-
华为云开发者日·2024年度创享峰会
2024/12/23 周一 14:00-16:00
华为云讲师团
华为云开发者日HDC.Cloud Day是面向全球开发者的旗舰活动,汇聚来自千行百业、高校及科研院所的开发人员。致力于打造开发者专属的技术盛宴,全方位服务与赋能开发者围绕华为云生态“知、学、用、创、商”的成长路径。通过前沿的技术分享、场景化的动手体验、优秀的应用创新推介,为开发者提供沉浸式学习与交流平台。开放创新,与开发者共创、共享、共赢未来。
回顾中 -
GaussDB管理平台TPOPS,DBA高效运维的一站式解决方案
2024/12/24 周二 16:30-18:00
Leo 华为云数据库DTSE技术布道师
数据库的复杂运维,是否让你感到头疼不已?今天,华为云GaussDB管理平台将彻底来改观!本期直播,我们将深入探索GaussDB管理平台的TPOPS功能,带你感受一键式部署安装的便捷,和智能化运维管理的高效,让复杂的运维、管理变得简单,让简单变得可靠。
去报名 -
华为云软件开发生产线(CodeArts)11月新特性解读
2024/12/24 周二 19:00-20:00
苏柏亚培 华为云高级产品经理
不知道产品的最新特性?没法和产品团队建立直接的沟通?本期直播产品经理将为您解读华为云软件开发生产线10月发布的新特性,并在直播过程中为您答疑解惑。
即将直播
热门标签