- 本篇的主题内容是讲解人工智能(AI)与操作系统之间相辅相成的关系,以及它们之间的紧密合作,并且本文会列举两个华为的 OS 级别的产品来说明或者说让读者更能容易的理解为什么说 AI 与 操作系统 OS 是相辅相成的。 本篇的主题内容是讲解人工智能(AI)与操作系统之间相辅相成的关系,以及它们之间的紧密合作,并且本文会列举两个华为的 OS 级别的产品来说明或者说让读者更能容易的理解为什么说 AI 与 操作系统 OS 是相辅相成的。
- @[toc] 摘要论文翻译:https://wanghao.blog.csdn.net/article/details/131347001?spm=1001.2014.3001.5502官方源码:https://github.com/sail-sg/inceptionnext这是一篇来自颜水成团队的论文。作者提出InceptionNext,将大核深度卷积分解为沿通道维度的四个平行分支,即小方... @[toc] 摘要论文翻译:https://wanghao.blog.csdn.net/article/details/131347001?spm=1001.2014.3001.5502官方源码:https://github.com/sail-sg/inceptionnext这是一篇来自颜水成团队的论文。作者提出InceptionNext,将大核深度卷积分解为沿通道维度的四个平行分支,即小方...
- 昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动微分、分布式训练和推理、模型部署等功能,支持多种硬件平台,包括CPU、GPU和Ascend AI 处理器。MindSpore采用图和算子相结合的编程模型,能够高效地处理复杂的深度学习任务。它具有灵活的设计、高效的性能和易于使用的接口,使开发者能够更快地开发和部署AI应用。 昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动微分、分布式训练和推理、模型部署等功能,支持多种硬件平台,包括CPU、GPU和Ascend AI 处理器。MindSpore采用图和算子相结合的编程模型,能够高效地处理复杂的深度学习任务。它具有灵活的设计、高效的性能和易于使用的接口,使开发者能够更快地开发和部署AI应用。
- @[toc]在上一篇文章中完成了前期的准备工作,见链接:CloFormer实战:使用CloFormer实现图像分类任务(一)这篇主要是讲解如何训练和测试 训练部分完成上面的步骤后,就开始train脚本的编写,新建train.py 导入项目使用的库在train.py导入import jsonimport osimport matplotlib.pyplot as pltimport torch... @[toc]在上一篇文章中完成了前期的准备工作,见链接:CloFormer实战:使用CloFormer实现图像分类任务(一)这篇主要是讲解如何训练和测试 训练部分完成上面的步骤后,就开始train脚本的编写,新建train.py 导入项目使用的库在train.py导入import jsonimport osimport matplotlib.pyplot as pltimport torch...
- @[toc] 摘要论文翻译:https://blog.csdn.net/m0_47867638/article/details/131161083官方源码:https://github.com/qhfan/CloFormer这是一篇来自清华大学的论文。作者提出CloFormer,一种轻量级的视觉transformer,利用上下文感知局部增强。CloFormer探索了普通卷积算子中经常使用的全... @[toc] 摘要论文翻译:https://blog.csdn.net/m0_47867638/article/details/131161083官方源码:https://github.com/qhfan/CloFormer这是一篇来自清华大学的论文。作者提出CloFormer,一种轻量级的视觉transformer,利用上下文感知局部增强。CloFormer探索了普通卷积算子中经常使用的全...
- @[toc]在上一篇文章中完成了前期的准备工作,见链接:VanillaNet实战:使用VanillaNet实现图像分类(一)这篇主要是讲解如何训练和测试 训练部分完成上面的步骤后,就开始train脚本的编写,新建train.py 导入项目使用的库在train.py导入import jsonimport osimport matplotlib.pyplot as pltimport torch... @[toc]在上一篇文章中完成了前期的准备工作,见链接:VanillaNet实战:使用VanillaNet实现图像分类(一)这篇主要是讲解如何训练和测试 训练部分完成上面的步骤后,就开始train脚本的编写,新建train.py 导入项目使用的库在train.py导入import jsonimport osimport matplotlib.pyplot as pltimport torch...
- 1.学习总结摘要:Transformer是一种神经网络结构,由Vaswani等人在2017年的论文“Attention Is All You Need”中提出,用于处理机器翻译、语言建模和文本生成等自然语言处理任务。 1.1注意力机制注意力机制(Attention Mechanism)是深度学习中一种模拟人类视觉或听觉系统的工作方式的技术。它的灵感来自于人类的感知过程,即根据输入的信息,有... 1.学习总结摘要:Transformer是一种神经网络结构,由Vaswani等人在2017年的论文“Attention Is All You Need”中提出,用于处理机器翻译、语言建模和文本生成等自然语言处理任务。 1.1注意力机制注意力机制(Attention Mechanism)是深度学习中一种模拟人类视觉或听觉系统的工作方式的技术。它的灵感来自于人类的感知过程,即根据输入的信息,有...
- 华为云ModelArts的应用价值—ModelArts 一键训练和部署口罩识别AI模型云服务、API、SDK,调试,查看,我都行 阅读短文您可以学习到:人工智能AI之ModelArts的训练、识别、分析1 Classroom和Toolkit的关系1.1 Classroom的简介classroom是基于华为云的云上软件教学服务,支持初级开发者和高校师生实现备课、上课、作业、... 华为云ModelArts的应用价值—ModelArts 一键训练和部署口罩识别AI模型云服务、API、SDK,调试,查看,我都行 阅读短文您可以学习到:人工智能AI之ModelArts的训练、识别、分析1 Classroom和Toolkit的关系1.1 Classroom的简介classroom是基于华为云的云上软件教学服务,支持初级开发者和高校师生实现备课、上课、作业、...
- 华为云ModelArts助力AI开发平台—ModelArts SDK打通本地IDE与云端训练资源云服务、API、SDK,调试,查看,我都行 阅读短文您可以学习到:人工智能AI之ModelArts的训练、打通、资源1 Classroom和Toolkit的关系1.1 Classroom的简介classroom是基于华为云的云上软件教学服务,支持初级开发者和高校师生实现备课、上... 华为云ModelArts助力AI开发平台—ModelArts SDK打通本地IDE与云端训练资源云服务、API、SDK,调试,查看,我都行 阅读短文您可以学习到:人工智能AI之ModelArts的训练、打通、资源1 Classroom和Toolkit的关系1.1 Classroom的简介classroom是基于华为云的云上软件教学服务,支持初级开发者和高校师生实现备课、上...
- 大规模语言模型(Large Language Models,LLM),也称大规模语言模型或大型语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标注文本进行训练。自2018 年以来,Google、OpenAI、Meta、百度、华为等公司和研究机构都相继发布了包括BERT[1],GPT[6] 等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。... 大规模语言模型(Large Language Models,LLM),也称大规模语言模型或大型语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标注文本进行训练。自2018 年以来,Google、OpenAI、Meta、百度、华为等公司和研究机构都相继发布了包括BERT[1],GPT[6] 等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。...
- 全新Self-RAG框架亮相,自适应检索增强助力超越ChatGPT与Llama2,提升事实性与引用准确性 全新Self-RAG框架亮相,自适应检索增强助力超越ChatGPT与Llama2,提升事实性与引用准确性
- 深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测方法与计算成本的关系。具体来说,尽管深度学习方法在日志异常检测方面取得了出色的性能,但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断,从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究... 深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测方法与计算成本的关系。具体来说,尽管深度学习方法在日志异常检测方面取得了出色的性能,但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断,从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究...
- 本文全面探讨了ROC曲线(Receiver Operating Characteristic Curve)的重要性和应用,从其历史背景、数学基础到Python实现以及关键评价指标。文章旨在提供一个深刻而全面的视角,以帮助您更好地理解和应用ROC曲线在模型评估中的作用。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机... 本文全面探讨了ROC曲线(Receiver Operating Characteristic Curve)的重要性和应用,从其历史背景、数学基础到Python实现以及关键评价指标。文章旨在提供一个深刻而全面的视角,以帮助您更好地理解和应用ROC曲线在模型评估中的作用。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机...
- 基于TensorFlow的Python API开发的训练脚本默认运行在CPU/GPU/TPU上,为了使这些脚本能够利用昇腾AI处理器的强大算力,需要将其迁移到昇腾平台。本期分享几个TensorFlow网络迁移到昇腾平台后执行失败或者执行性能差的典型案例,并给出原因分析及解决方法。01 数据预处理中存在资源类算子,导致训练异常02 数据预处理中存在tf.Variable,导致训练异常03 动态... 基于TensorFlow的Python API开发的训练脚本默认运行在CPU/GPU/TPU上,为了使这些脚本能够利用昇腾AI处理器的强大算力,需要将其迁移到昇腾平台。本期分享几个TensorFlow网络迁移到昇腾平台后执行失败或者执行性能差的典型案例,并给出原因分析及解决方法。01 数据预处理中存在资源类算子,导致训练异常02 数据预处理中存在tf.Variable,导致训练异常03 动态...
- 本文深入探讨了文本生成的多种方法,从传统的基于统计和模板的技术到现代的神经网络模型,尤其是LSTM和Transformer架构。文章还详细介绍了大型预训练模型如GPT在文本生成中的应用,并提供了Python和PyTorch的实现代码。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资... 本文深入探讨了文本生成的多种方法,从传统的基于统计和模板的技术到现代的神经网络模型,尤其是LSTM和Transformer架构。文章还详细介绍了大型预训练模型如GPT在文本生成中的应用,并提供了Python和PyTorch的实现代码。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考
2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本
2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签