- 该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程,介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。 该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程,介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。
- 本文介绍柯依力 YOLO 训练调优,包括 NPU 环境准备与训练,如创建桶、授权、Notebook 等;精度对齐,用 msprobe 工具定位解决精度问题;性能调优,用 advisor 工具解决亲和 API 等问题;还给出训练加速参数推荐配置,提升训练效率。 本文介绍柯依力 YOLO 训练调优,包括 NPU 环境准备与训练,如创建桶、授权、Notebook 等;精度对齐,用 msprobe 工具定位解决精度问题;性能调优,用 advisor 工具解决亲和 API 等问题;还给出训练加速参数推荐配置,提升训练效率。
- 文章来源于时习知公众号全文约2484字,阅读约需9分钟DeepSeek的惊艳亮相让人们开始关注稀疏模式(如MoE,混合专家模型),这种模式不仅改变了AI模型的训练和推理方式,还对语料(知识)的管理和利用提出了新的挑战与机遇。接下来,笔者将从稀疏模式的特点分析出发,来探讨稀疏模式对于语料需求变化和RAG(Retrieval-Augmented Generation,检索增强生成)的影响。 PA... 文章来源于时习知公众号全文约2484字,阅读约需9分钟DeepSeek的惊艳亮相让人们开始关注稀疏模式(如MoE,混合专家模型),这种模式不仅改变了AI模型的训练和推理方式,还对语料(知识)的管理和利用提出了新的挑战与机遇。接下来,笔者将从稀疏模式的特点分析出发,来探讨稀疏模式对于语料需求变化和RAG(Retrieval-Augmented Generation,检索增强生成)的影响。 PA...
- AI大模型的挑战与实践:DeepMind的经验分享随着人工智能技术的迅猛发展,AI大模型逐渐成为各大科技公司及研究机构的研发重点。DeepMind,作为Google旗下的人工智能研究机构,一直走在AI大模型技术的前沿。本文将深入探讨AI大模型在实践中的挑战及DeepMind的应对策略,并结合代码实例,展示一些实践经验。 AI大模型的背景与发展AI大模型,通常指的是参数量极大、计算能力需求极... AI大模型的挑战与实践:DeepMind的经验分享随着人工智能技术的迅猛发展,AI大模型逐渐成为各大科技公司及研究机构的研发重点。DeepMind,作为Google旗下的人工智能研究机构,一直走在AI大模型技术的前沿。本文将深入探讨AI大模型在实践中的挑战及DeepMind的应对策略,并结合代码实例,展示一些实践经验。 AI大模型的背景与发展AI大模型,通常指的是参数量极大、计算能力需求极...
- 网上有许多DeepSeek训练技术的相关文章,但大部分都涉及到大量技术术语,非专业人士不容易理解。为了让大家能够快速理解DeepSeek,笔者把网络知识结合自己的思考,用一种通俗的方式来给大家讲解DeepSeek的训练技术。 DeepSeek-R1中提到的模型训练流程如下: 看不懂?没关系,接下来我们用通俗的例子来讲明白里面原理。 01 R1-Zero (R1模型的前世)DeepSeek团队... 网上有许多DeepSeek训练技术的相关文章,但大部分都涉及到大量技术术语,非专业人士不容易理解。为了让大家能够快速理解DeepSeek,笔者把网络知识结合自己的思考,用一种通俗的方式来给大家讲解DeepSeek的训练技术。 DeepSeek-R1中提到的模型训练流程如下: 看不懂?没关系,接下来我们用通俗的例子来讲明白里面原理。 01 R1-Zero (R1模型的前世)DeepSeek团队...
- msModelSlim支持多种模型压缩算法(包括量化压缩、稀疏压缩等),为开发者提供更加灵活、高效的模型压缩量化方案。 msModelSlim支持多种模型压缩算法(包括量化压缩、稀疏压缩等),为开发者提供更加灵活、高效的模型压缩量化方案。
- 本文将会介绍一些更高阶的并行方式,如序列并行(SP),上下文并行(CP),混合序列并行Ulysess,ZeRO系列并行优化策略,完全分片数据并行(FSDP)。并且,在文章最后将汇总所有介绍过的并行方案与它们的通信模式,帮助读者初步建立起分布式训练与集合通信的知识结构体系。 本文将会介绍一些更高阶的并行方式,如序列并行(SP),上下文并行(CP),混合序列并行Ulysess,ZeRO系列并行优化策略,完全分片数据并行(FSDP)。并且,在文章最后将汇总所有介绍过的并行方案与它们的通信模式,帮助读者初步建立起分布式训练与集合通信的知识结构体系。
- 感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火? 感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火?
- 本案例主要内容是基于云主机使用Spotlight实现电商平台推荐系统,Spotlight是一个面向推荐系统的Python库,它利用PyTorch的强大计算能力,构建了一系列深浅不一的推荐模型。 本案例主要内容是基于云主机使用Spotlight实现电商平台推荐系统,Spotlight是一个面向推荐系统的Python库,它利用PyTorch的强大计算能力,构建了一系列深浅不一的推荐模型。
- 文章来源于时习知公众号全文约2029字,阅读约需7分钟。随着人工智能技术的快速发展,AI Agent成为大模型研究的热点。AI Agent是一种具备主动思考和行动能力的智能体,能够自主感知环境、形成记忆、规划和执行任务,并能与其他Agent协作。但是AI Agent的发展也面临较多的挑战,下面我们就来深入探讨一下。 01 AI Agent发展现状 AI Agent是指通过训练大规模的神经网... 文章来源于时习知公众号全文约2029字,阅读约需7分钟。随着人工智能技术的快速发展,AI Agent成为大模型研究的热点。AI Agent是一种具备主动思考和行动能力的智能体,能够自主感知环境、形成记忆、规划和执行任务,并能与其他Agent协作。但是AI Agent的发展也面临较多的挑战,下面我们就来深入探讨一下。 01 AI Agent发展现状 AI Agent是指通过训练大规模的神经网...
- 华为云Stack构建ModelArts数据工程套件,为大模型高效率高质量供数 华为云Stack构建ModelArts数据工程套件,为大模型高效率高质量供数
- 致力于借助先进科技技术,赋能数字农业技术装备提升改造的杭州盈禾嘉田科技有限公司,运用AI+大数据技术为农民提供便捷高效的农业科技服务,通过整合和连接产业链中的技术专家、农资服务商和农产品销售渠道资源,构建标准化种植追溯体系与大数据分析能力,为政府及行业用户提供专业解决方案,服务于农作物种植管理工作,在作物长势分析、病虫害调查、农事操作记录、采收期果实管理等田间种植各环节工作中实现自动识别、自动计数 致力于借助先进科技技术,赋能数字农业技术装备提升改造的杭州盈禾嘉田科技有限公司,运用AI+大数据技术为农民提供便捷高效的农业科技服务,通过整合和连接产业链中的技术专家、农资服务商和农产品销售渠道资源,构建标准化种植追溯体系与大数据分析能力,为政府及行业用户提供专业解决方案,服务于农作物种植管理工作,在作物长势分析、病虫害调查、农事操作记录、采收期果实管理等田间种植各环节工作中实现自动识别、自动计数
- 为抓住AI大模型技术变革的机遇,通过AI辅助内部业务,提升华为内部各业务领域的作业效率和质量,项目组组织训战让各业务领域懂AI用AI。我参加了上周(6月20日至22日)的第六期训战(for HR领域),收获非常大,必须分享给大家。 为抓住AI大模型技术变革的机遇,通过AI辅助内部业务,提升华为内部各业务领域的作业效率和质量,项目组组织训战让各业务领域懂AI用AI。我参加了上周(6月20日至22日)的第六期训战(for HR领域),收获非常大,必须分享给大家。
- 解难题做难事,重塑干行万业 解难题做难事,重塑干行万业
- 推进代码大模型的发展,共创产业价值 推进代码大模型的发展,共创产业价值
上滑加载中
推荐直播
-
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day1)
2025/03/29 周六 09:00-18:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day2)
2025/03/30 周日 09:00-12:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
从AI基础到昇腾:大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30
不易 / 华为云学堂技术讲师
昇腾是华为研发的AI芯片,其具有哪些能力?我们如何基于其进行开发?本期直播将从AI以及大模型基础知识开始,介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区,旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
热门标签