- 首先我们要了解什么是阈值,阈值能干什么?简单阈值是我们设置的一个临界值,这个临界值的作用就是对应图像中的每一个像素,如果它小于这个临界值就将其设置为0,若其大于这个临界值则将其设置为最大值(一般为255),在使用阈值之后的图像就会只剩两个颜色像素:最大值和最小值,在掩膜的运用比较多,我们后续详细讲 首先我们要了解什么是阈值,阈值能干什么?简单阈值是我们设置的一个临界值,这个临界值的作用就是对应图像中的每一个像素,如果它小于这个临界值就将其设置为0,若其大于这个临界值则将其设置为最大值(一般为255),在使用阈值之后的图像就会只剩两个颜色像素:最大值和最小值,在掩膜的运用比较多,我们后续详细讲
- 语言模型往往被用于文字识别的后处理阶段,本文将语言模型的先验信息和文字的视觉特征进行交互和增强,从而进一步提升文字识别的性能。 语言模型往往被用于文字识别的后处理阶段,本文将语言模型的先验信息和文字的视觉特征进行交互和增强,从而进一步提升文字识别的性能。
- 本文简要介绍CVPR 2022录用的论文“Knowledge Mining with Scene Text for Fine-Grained Recognition”的主要工作。该论文旨在利用场景文本的线索来提升细粒度图像识别的性能。本文通过场景文字从人类知识库(Wikipedia)中挖掘其背后丰富的上下文语义信息,并结合视觉信息来共同推理图像内容。数据集和代码已开源,下载地址见文末。 本文简要介绍CVPR 2022录用的论文“Knowledge Mining with Scene Text for Fine-Grained Recognition”的主要工作。该论文旨在利用场景文本的线索来提升细粒度图像识别的性能。本文通过场景文字从人类知识库(Wikipedia)中挖掘其背后丰富的上下文语义信息,并结合视觉信息来共同推理图像内容。数据集和代码已开源,下载地址见文末。
- 文字检索是从图像库中检索出包含特定字符串的图像,并且同时定位该字符串在图像中位置的过程(如图1所示),是场景文字理解中的重要科学问题,被应用于商品检索、图书馆书籍管理、网络图像安全审核等场景中,极大地提高了生产效率。此外,文字识别要求图像中的所有文本实例都被精准地检测和识别,不同于端到端的文字识别任务,文字检索任务更关注于搜寻用户所感兴趣的文本。 文字检索是从图像库中检索出包含特定字符串的图像,并且同时定位该字符串在图像中位置的过程(如图1所示),是场景文字理解中的重要科学问题,被应用于商品检索、图书馆书籍管理、网络图像安全审核等场景中,极大地提高了生产效率。此外,文字识别要求图像中的所有文本实例都被精准地检测和识别,不同于端到端的文字识别任务,文字检索任务更关注于搜寻用户所感兴趣的文本。
- 在本文中,我将带着大家使用 Python 和 OpenCV 对图像进行加水印。水印有意在图像上留下文本/标志,很多博主会使用水印来保护图像的版权。使用水印我们可以确保图像的所有者是在图像上印制水印的人。水印前的图片:logo.png: 🌌 第 1 步:导入 OpenCV 并读取logo和要应用水印的图像# 使用 OpenCV 导入 cv2 的水印图像import cv2# 导入我们将要使用... 在本文中,我将带着大家使用 Python 和 OpenCV 对图像进行加水印。水印有意在图像上留下文本/标志,很多博主会使用水印来保护图像的版权。使用水印我们可以确保图像的所有者是在图像上印制水印的人。水印前的图片:logo.png: 🌌 第 1 步:导入 OpenCV 并读取logo和要应用水印的图像# 使用 OpenCV 导入 cv2 的水印图像import cv2# 导入我们将要使用...
- 计算机视觉没那么枯燥,这篇文章用最通俗的语言和最有趣的应用介绍什么是图像金字塔,配套代码加深理解 计算机视觉没那么枯燥,这篇文章用最通俗的语言和最有趣的应用介绍什么是图像金字塔,配套代码加深理解
- 透视空间所有变换都是投影变换的特例,本节进一步研究投影变换矩阵(单应性矩阵)的估计 透视空间所有变换都是投影变换的特例,本节进一步研究投影变换矩阵(单应性矩阵)的估计
- 整体前向过程:Yolo-v5相较于Yolo-v4来说改动不是特别大,最主要的区别在于对于anchor的处理机制,这个机制也是让Yolo-v5收敛快的核心,另外Yolo-v5的loss与之前的Yolo系列也有些差别。首先对于数据增强,Yolov5的输入端采用了和Yolov4一样的Mosaic数据增强的方式,Yolov3则没有采用这种数据增强,Mosaic的具体细节不在这里过多阐述,不过这种方式... 整体前向过程:Yolo-v5相较于Yolo-v4来说改动不是特别大,最主要的区别在于对于anchor的处理机制,这个机制也是让Yolo-v5收敛快的核心,另外Yolo-v5的loss与之前的Yolo系列也有些差别。首先对于数据增强,Yolov5的输入端采用了和Yolov4一样的Mosaic数据增强的方式,Yolov3则没有采用这种数据增强,Mosaic的具体细节不在这里过多阐述,不过这种方式...
- OpenCV是开源的计算机视觉库,这篇文章主要是介绍OpenCV如何调用YOLOv3的模型完成目标检测,YOLO的目标检测是非常强大的,YOLOV3自带的模型本身可以完成80多种目标检测。 OpenCV是开源的计算机视觉库,这篇文章主要是介绍OpenCV如何调用YOLOv3的模型完成目标检测,YOLO的目标检测是非常强大的,YOLOV3自带的模型本身可以完成80多种目标检测。
- 这个React应用左上角的react图标,以及右上角的小人图标,是如何显示出来的?把图片放到React应用的public文件夹下:在React应用的ShellBar组件里,将图片名称赋给对应的logo和profile属性即可:运行时的实现:假设我使用SAP UI5 Web Component的React控件, 比如柱状图和折线图:导入useState函数,默认加载状态为false:每次点击屏... 这个React应用左上角的react图标,以及右上角的小人图标,是如何显示出来的?把图片放到React应用的public文件夹下:在React应用的ShellBar组件里,将图片名称赋给对应的logo和profile属性即可:运行时的实现:假设我使用SAP UI5 Web Component的React控件, 比如柱状图和折线图:导入useState函数,默认加载状态为false:每次点击屏...
- 一文读懂 一文读懂
- 预计要火、 Demo 可玩 预计要火、 Demo 可玩
- 超分重建 PSSNR、SSIM 超分重建 PSSNR、SSIM
- 有效分享 有效分享
- 资源导航网站 资源导航网站
上滑加载中
推荐直播
-
香橙派AIpro的远程推理框架与实验案例
2025/07/04 周五 19:00-20:00
郝家胜 -华为开发者布道师-高校教师
AiR推理框架创新采用将模型推理与模型应用相分离的机制,把香橙派封装为AI推理黑盒服务,构建了分布式远程推理框架,并提供多种输入模态、多种输出方式以及多线程支持的高度复用框架,解决了开发板环境配置复杂上手困难、缺乏可视化体验和资源稀缺课程受限等痛点问题,真正做到开箱即用,并支持多种笔记本电脑环境、多种不同编程语言,10行代码即可体验图像分割迁移案例。
回顾中 -
鸿蒙端云一体化应用开发
2025/07/10 周四 19:00-20:00
倪红军 华为开发者布道师-高校教师
基于鸿蒙平台终端设备的应用场景越来越多、使用范围越来越广。本课程以云数据库服务为例,介绍云侧项目应用的创建、新建对象类型、新增存储区及向对象类型中添加数据对象的方法,端侧(HarmonyOS平台)一体化工程项目的创建、云数据资源的关联方法及对云侧数据的增删改查等操作方法,为开发端云一体化应用打下坚实基础。
回顾中
热门标签