- 物体检测-Faster R-CNN物体检测是计算机视觉中的一个重要的研究领域,在人流检测,行人跟踪,自动驾驶,医学影像等领域有着广泛的应用。不同于简单的图像分类,物体检测旨在对图像中的目标进行精确识别,包括物体的位置和分类,因此能够应用于更多高层视觉处理的场景。例如在自动驾驶领域,需要辨识摄像头拍摄的图像中的车辆、行人、交通指示牌及其位置,以便进一步根据这些数据决定驾驶策略。上一期学习案例中... 物体检测-Faster R-CNN物体检测是计算机视觉中的一个重要的研究领域,在人流检测,行人跟踪,自动驾驶,医学影像等领域有着广泛的应用。不同于简单的图像分类,物体检测旨在对图像中的目标进行精确识别,包括物体的位置和分类,因此能够应用于更多高层视觉处理的场景。例如在自动驾驶领域,需要辨识摄像头拍摄的图像中的车辆、行人、交通指示牌及其位置,以便进一步根据这些数据决定驾驶策略。上一期学习案例中...
- 前言本文介绍循环神经网络的案例,通过搭建和训练一个模型,来对电影评论进行“文本分类”;将影评分为积极或消极两类;是一个二分类问题。使用到网络电影数据库的 IMDB 数据集,包含 50,000 条影评文本,所有评论都具有正面或负面情绪,这是二元情绪分类的数据集。思路流程导入数据集探索集数据,并进行数据预处理构建模型(搭建神经网络、编译模型)训练模型(把数据输入模型、评估准确性、作出预测、验证... 前言本文介绍循环神经网络的案例,通过搭建和训练一个模型,来对电影评论进行“文本分类”;将影评分为积极或消极两类;是一个二分类问题。使用到网络电影数据库的 IMDB 数据集,包含 50,000 条影评文本,所有评论都具有正面或负面情绪,这是二元情绪分类的数据集。思路流程导入数据集探索集数据,并进行数据预处理构建模型(搭建神经网络、编译模型)训练模型(把数据输入模型、评估准确性、作出预测、验证...
- 偶然知道了一个图神经网络的包DGL(Deep Graph Library),找到它的github主页瞻仰一下。作者整理并以统一的架构实现了数十种图神经网络模型,基本上涵盖了图神经网络领域内的主流研究。鉴于作者文档已经写得非常完备了,而且对应着每一篇论文给出了相应的例子,这里就不再重复介绍它的使用方法了。刚好最近准备追一追最近几年图神经网络最新进展,就准备借用作者给出的论文列表一篇一篇地看过来了。 偶然知道了一个图神经网络的包DGL(Deep Graph Library),找到它的github主页瞻仰一下。作者整理并以统一的架构实现了数十种图神经网络模型,基本上涵盖了图神经网络领域内的主流研究。鉴于作者文档已经写得非常完备了,而且对应着每一篇论文给出了相应的例子,这里就不再重复介绍它的使用方法了。刚好最近准备追一追最近几年图神经网络最新进展,就准备借用作者给出的论文列表一篇一篇地看过来了。
- 题目:An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale作者: Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov,Dirk Weissenborn, Xiaohua Zhai …单位: Google Brain发表会议及时间: ICLR20... 题目:An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale作者: Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov,Dirk Weissenborn, Xiaohua Zhai …单位: Google Brain发表会议及时间: ICLR20...
- 二元Huffman编码的Python实现 二元Huffman编码的Python实现
- 机器学习 — 自组织映射网络SOM聚类算法SOM(Self-Origanizing Maps),或者SOFM(Self-Origanizing Feature Maps),自组织映射网络,是一种基于神经网络的聚类算法,该算法为无监督学习算法。 SOM的基本结构SOM是一个单层的神经网络,也就是说---- SOM算法只包含输入层和计算层(Computational Layer) SOM结构... 机器学习 — 自组织映射网络SOM聚类算法SOM(Self-Origanizing Maps),或者SOFM(Self-Origanizing Feature Maps),自组织映射网络,是一种基于神经网络的聚类算法,该算法为无监督学习算法。 SOM的基本结构SOM是一个单层的神经网络,也就是说---- SOM算法只包含输入层和计算层(Computational Layer) SOM结构...
- MNIST 手写数字识别教程(PyTorch) MNIST 数据集简介MNIST数据集(Mixed National Institute of Standards and Technology database)是美国国家标准与技术研究院收集整理的大型手写数字数据库,包含60,000个示例的训练集以及10,000个示例的测试集.本教程会使用PyTorch进行一个简单神经网络模型对手写数字进... MNIST 手写数字识别教程(PyTorch) MNIST 数据集简介MNIST数据集(Mixed National Institute of Standards and Technology database)是美国国家标准与技术研究院收集整理的大型手写数字数据库,包含60,000个示例的训练集以及10,000个示例的测试集.本教程会使用PyTorch进行一个简单神经网络模型对手写数字进...
- 【生长吧!Python】有奖征文火热进行中:https://bbs.huaweicloud.cn/blogs/278897 【生长吧!Python】有奖征文火热进行中:https://bbs.huaweicloud.cn/blogs/278897
- 随着Transformer模型在自然语言领域的兴起,越来越多的研究工作也在尝试将其应用到其他AI相关领域。本文中的DETR算法就是Transformer在CV领域中的目标检测问题上的一个初步尝试。 随着Transformer模型在自然语言领域的兴起,越来越多的研究工作也在尝试将其应用到其他AI相关领域。本文中的DETR算法就是Transformer在CV领域中的目标检测问题上的一个初步尝试。
- 多目标跟踪这个具有挑战性的任务需要同时完成跟踪目标的初始化、定位并构建时空上的跟踪轨迹。本文将这个任务构建为一个帧到帧的集合预测问题,并提出了一个基于transformer的端到端的多目标跟踪方法TrackFormer。本文模型通过注意力机制实现了帧与帧之间的数据关联,完成了视频序列间的跟踪轨迹的预测。 多目标跟踪这个具有挑战性的任务需要同时完成跟踪目标的初始化、定位并构建时空上的跟踪轨迹。本文将这个任务构建为一个帧到帧的集合预测问题,并提出了一个基于transformer的端到端的多目标跟踪方法TrackFormer。本文模型通过注意力机制实现了帧与帧之间的数据关联,完成了视频序列间的跟踪轨迹的预测。
- 一、概念介绍深度神经网络(Deep Neural Networks)是深度学习的基础,是近年来计算机人工智能领域非常火的研究方向,其相比传统的浅层机器学习而言能够挖掘出更多隐含的特征。神经网络以其与人类神经元相类似的元素通过相互连接形成网络拓扑结构,而这种模型能够自主挖掘更深层次特征。声音信号是一维时域信号,通过傅里叶变换,到频域上可以看出信号的频率分布,可以通过时域和频域信息通过深度学习的... 一、概念介绍深度神经网络(Deep Neural Networks)是深度学习的基础,是近年来计算机人工智能领域非常火的研究方向,其相比传统的浅层机器学习而言能够挖掘出更多隐含的特征。神经网络以其与人类神经元相类似的元素通过相互连接形成网络拓扑结构,而这种模型能够自主挖掘更深层次特征。声音信号是一维时域信号,通过傅里叶变换,到频域上可以看出信号的频率分布,可以通过时域和频域信息通过深度学习的...
- 目标检测是计算机视觉项目中非常重要的一部分,而Yolo系列是常用的目标检测算法。目前使用较多的是Yolov3,Yolov4和Yolov5算法,是在Yolov3比较经典的one-stage网络结构的各个部分不断整合创新发展起来的。Yolov5的官方代码中,有Yolov5s、Yolov5m、Yolov5l、Yolov5x四个模型。本文将对Yolov5做一个介绍,并在ModelArts平台上实践。 目标检测是计算机视觉项目中非常重要的一部分,而Yolo系列是常用的目标检测算法。目前使用较多的是Yolov3,Yolov4和Yolov5算法,是在Yolov3比较经典的one-stage网络结构的各个部分不断整合创新发展起来的。Yolov5的官方代码中,有Yolov5s、Yolov5m、Yolov5l、Yolov5x四个模型。本文将对Yolov5做一个介绍,并在ModelArts平台上实践。
- 1. 深扒CNN:也谈机器学习的本质 现在,从OCR性能优化系列(一)中的图1左下角的输入开始,串一遍图一的流程。首先是输入27张待识别的文字片段图片,每张图片的大小为32*132。这些图片会经过一个CNN网络进行编码,输出32个27*384的初步编码矩阵。如下图所示: 值得注意的是,在这步操作中出现了维度次序的调整,即输入由27*(32*132)变成了 2... 1. 深扒CNN:也谈机器学习的本质 现在,从OCR性能优化系列(一)中的图1左下角的输入开始,串一遍图一的流程。首先是输入27张待识别的文字片段图片,每张图片的大小为32*132。这些图片会经过一个CNN网络进行编码,输出32个27*384的初步编码矩阵。如下图所示: 值得注意的是,在这步操作中出现了维度次序的调整,即输入由27*(32*132)变成了 2...
- 在cnn中单个layer的不同卷积核对精度的影响到底是怎样的?在这里做下实验来对比下。 在cnn中单个layer的不同卷积核对精度的影响到底是怎样的?在这里做下实验来对比下。
- L1范数 剪枝 L1范数 剪枝
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考
2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本
2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签