- 本文为MoXing系列文章第五篇,主要介绍Optimizer、OptimizerWrapper。 本文为MoXing系列文章第五篇,主要介绍Optimizer、OptimizerWrapper。
- 本文为MoXing系列文章第四篇,主要介绍MoXing将模型定义在model_fn方法中,并在mox.run时注册该方法。 本文为MoXing系列文章第四篇,主要介绍MoXing将模型定义在model_fn方法中,并在mox.run时注册该方法。
- 本文为MoXing系列文章第三篇,主要介绍MoXing将数据的输入定义在input_fn方法中,并在mox.run时注册该方法。 本文为MoXing系列文章第三篇,主要介绍MoXing将数据的输入定义在input_fn方法中,并在mox.run时注册该方法。
- 本文为MoXing系列文章第一篇,主要介绍什么是MoXing,MoXing API的优势以及MoXing程序的基本结构。 本文为MoXing系列文章第一篇,主要介绍什么是MoXing,MoXing API的优势以及MoXing程序的基本结构。
- 华为云深度学习镜像可用于构建深度学习开发环境,可实现机器视觉、语音识别、自然语言处理等示例开发,可广泛应用于金融、物联网IOT、平安城市等业务领域。该镜像基于华为云环境下,提供给华为云客户免费使用。 华为云深度学习镜像可用于构建深度学习开发环境,可实现机器视觉、语音识别、自然语言处理等示例开发,可广泛应用于金融、物联网IOT、平安城市等业务领域。该镜像基于华为云环境下,提供给华为云客户免费使用。
- 最近做吞吐量调试涉及到输入batch_size的设置,为了把算力和显存用起来,同时不触发out of memory,需要提前估计大模型推理过程中的显存占用,我参考了MindIE官网的这个文档完成了估计:https://www.hiascend.com/document/detail/zh/mindie/20RC2/mindieservice/servicedev/mindie_service... 最近做吞吐量调试涉及到输入batch_size的设置,为了把算力和显存用起来,同时不触发out of memory,需要提前估计大模型推理过程中的显存占用,我参考了MindIE官网的这个文档完成了估计:https://www.hiascend.com/document/detail/zh/mindie/20RC2/mindieservice/servicedev/mindie_service...
- 其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 @ZOMI酱 的2个视频写的,这2个视频讲的很好,建议大家都学习一下:《MOE终于迎来可视化解读!傻瓜都能看懂MoE核心原理!》和《使用昇腾NPU手撕MoE单机版代码!没想到如此简单!》。这篇文章是把我自己的理解梳理一下,加强自己的理解和记忆。 MOE结构概... 其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 @ZOMI酱 的2个视频写的,这2个视频讲的很好,建议大家都学习一下:《MOE终于迎来可视化解读!傻瓜都能看懂MoE核心原理!》和《使用昇腾NPU手撕MoE单机版代码!没想到如此简单!》。这篇文章是把我自己的理解梳理一下,加强自己的理解和记忆。 MOE结构概...
- 目录 简介论文简介ABSTRACT1 INTRODUCTION2 RELATED WORK2.1 Network Embedding2.2 Sample Selection 5 CONCLUS... 目录 简介论文简介ABSTRACT1 INTRODUCTION2 RELATED WORK2.1 Network Embedding2.2 Sample Selection 5 CONCLUS...
- 目录 简介论文简介ABSTRACT1 INTRODUCTION2 THE HIERARCHICAL MODEL2.1 Model Description 5 RELATED WORK6 CON... 目录 简介论文简介ABSTRACT1 INTRODUCTION2 THE HIERARCHICAL MODEL2.1 Model Description 5 RELATED WORK6 CON...
- 目录 简介简介ABSTRACT1. INTRODUCTION1.1 Problem Statement and Applications1.2 Contributions 2. RELATED... 目录 简介简介ABSTRACT1. INTRODUCTION1.1 Problem Statement and Applications1.2 Contributions 2. RELATED...
- 目录 pytorch实现学习率衰减 手动修改optimizer中的lr使用lr_scheduler LambdaLR——lambda函数衰减StepLR——阶梯式衰减MultiStepLR——多阶梯式衰减ExponentialLR——指数连续衰减 CosineAnnealingLR——余弦退火衰减Reduce... 目录 pytorch实现学习率衰减 手动修改optimizer中的lr使用lr_scheduler LambdaLR——lambda函数衰减StepLR——阶梯式衰减MultiStepLR——多阶梯式衰减ExponentialLR——指数连续衰减 CosineAnnealingLR——余弦退火衰减Reduce...
- 文章目录 博弈论常见模型必胜点和必败点的概念:必胜点和必败点的性质: 巴什博弈斐波那契博弈威佐夫博弈尼姆博弈SG函数与SG定理 博弈论 博弈论 ,是经济学的一个... 文章目录 博弈论常见模型必胜点和必败点的概念:必胜点和必败点的性质: 巴什博弈斐波那契博弈威佐夫博弈尼姆博弈SG函数与SG定理 博弈论 博弈论 ,是经济学的一个...
- 内容概况 文章目录 内容概况一、GraphSAGE模型二、YelpChi评论图数据集上的异常检测2.1题目:反欺诈检测2.2 数据集介绍 三、代码实现1.图数据准备1.1 数据预处理说明1.... 内容概况 文章目录 内容概况一、GraphSAGE模型二、YelpChi评论图数据集上的异常检测2.1题目:反欺诈检测2.2 数据集介绍 三、代码实现1.图数据准备1.1 数据预处理说明1....
- 目录 简介说明5.15.25.3结语 简介 Hello! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~ ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|... 目录 简介说明5.15.25.3结语 简介 Hello! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~ ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|...
- 一、粒子群优化前馈神经网络简介 1 前馈神经网络FNN 前馈神经网络FNN是解决非线性问题的很好模型,它通过梯度下降算法进行网络训练。FNN与时间序列法等传统方法相比,能够更好地来描述问题的非线性特性;... 一、粒子群优化前馈神经网络简介 1 前馈神经网络FNN 前馈神经网络FNN是解决非线性问题的很好模型,它通过梯度下降算法进行网络训练。FNN与时间序列法等传统方法相比,能够更好地来描述问题的非线性特性;...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
去报名
热门标签