论文阅读——利用Binary Hash Codes的深度图像检索
来源:互联网 发布:java http获取cookie 编辑:程序博客网 时间:2024/05/17 12:05
这篇文章是阅读《Deep Learning of Binary Hash Codes for Fast Image Retrieval》后的总结,该文章提出了一种利用CNN处理基于内容的图像检索的方法。
文章的重点
- 图像的binary hash code的生成方法
- 两阶段的检索方法——coarse-to-fine search strategy
1、基于内容的图像检索
1.1、基于内容的图像检索
基于内容的图像检索(Content-based Image Retrieval,CBIR)旨在通过对图像内容的分析搜索出相似的图像,其主要的工作有如下两点:
- 图像表示(image representation)
- 相似性度量(similarity measure)
1.2、基于CNN的图像内容提取
以AlexNet卷积神经网络为例,AlexNet的网络结构如下图所示:
(图片来源:ImageNet Classification with Deep Convolutional Neural Networks)
将最终的4096维向量作为最终图像的特征向量。这样的向量是一些高维向量,不利于计算。
2、二进制哈希编码的深度学习方法
2.1、模型结构
模型结构如下图所示:
在文章中,作者指出,该模型主要有三个主要的部分:
- 在大规模的ImageNet数据集上进行有监督的预训练;
- 在目标数据集上对模型进行微调,同时增加隐含层;
- 接收query,提取query的hash编码,同时查找相似的图像。
2.2、对hash的二进制编码的学习
本人认为在上图中,
F7 与F8 之间会存在一个隐层,这一点不影响对Latent Layer的构造。
如上所述,我们可以使用
解决的方法是在
2.3、检索
在深层的卷积神经网络中,浅层可以学习到局部的视觉表征,而深层可以捕获到适合识别的语义信息。
在检索阶段,作者采用了由粗到精的搜索策略(coarse-to-fine search strategy):
- 首先从Latent layer中检索出一批相似的候选集
2.3.1、粗粒度检索
对于图像
假设数据集中包含了
对于待检索的图像
2.3.2、细粒度检索
对于粗粒度检索出来的候选集
- 论文阅读——利用Binary Hash Codes的深度图像检索
- 基于deep learning的快速图像检索(Deep Learning of Binary Hash Codes for Fast Image Retrieval)
- 基于deep learning的快速图像检索(Deep Learning of Binary Hash Codes for Fast Image Retrieval)
- 图像检索系列一:Deep Learning of Binary Hash Codes for Fast Image Retrieval
- 图像检索系列一:Deep Learning of Binary Hash Codes for Fast Image Retrieval
- 快速图像检索(Deep Learning of Binary Hash Codes for Fast Image Retrieval)
- 论文阅读笔记(三)细粒度图像检索
- 基于神经网络的图像检索 Neural Codes for Image Retrieval
- 图像检索相关论文
- hash图像检索
- 图像检索系统《Deep Learning of Binary Hash Codes for Fast Image Retrieval》
- 深度学习在图像检索的应用
- 深度学习在图像检索的应用
- 论文总结(一)—基于深度学习的普通遥感图像质量改进
- hash 图像检索方法汇总
- hash 图像检索方法汇总
- CVPR14与图像视频检索相关的论文
- CVPR14与图像视频检索相关的论文
- 数组去重之简单,装逼方法,,,
- Apache Shiro V1.2 SecurityUtils与SecurityManager的关系以及Subject的创建
- gym 101061-B RGB plants 裸矩阵快速幂
- 记录一个Tomcat启动参数修改,导致不识别<async-supported>的问题
- Eclipse之Hibernate插件报错
- 论文阅读——利用Binary Hash Codes的深度图像检索
- java得到距离指定时间num时间的时间、以及反射调用方法、Log日志配置信息
- 多个项目部署到一个tomcat下面报错:Choose unique values for the 'webAppRootKey' context-param in your web.xml files
- Vue学习笔记(1)安装vue
- Permutations
- Java多线程(一)、多线程的基本概念和使用
- 思维导图是什么?思维导图原理及其作用
- 移动终端数据传输方式
- docker学习笔记