图像检索系统《Deep Learning of Binary Hash Codes for Fast Image Retrieval》
来源:互联网 发布:电脑群发短信的软件 编辑:程序博客网 时间:2024/06/13 12:41
引言
总结2015年CVPR论文《Deep Learning of Binary Hash Codes for Fast Image Retrieval》,论文主要内容是利用卷积神经网络(CNN)来构建图像相似度检测的深度学习方法。主要思想是讲卷积神经网络来提取图像特征,并将特征转化为二值量,根据二值向量来计算图像的相似度。
传统方法
图像检索的基础便是提取图像的特征信息,提取的特征信息越丰富,在进行检索时有更多的选择和更好的准确性,相比于传统的特征提取算法,如sift,CNN提取的信息会更丰富,在调整卷积kernel的大小时,得到的特征也会有变化。便有更多选择和变化,且网络一旦训练完成,检索的速度也不会慢。另外近似最近邻(Approximate Nearest Neighbor)算法也用来进行图像检索。如局部敏感度哈希locality-sensitive hashing,最优节点优先best bin first和Balanced box-decomposition tree等。
网络结构
由于CNN提取出的图像特征往往比较多,例如AlexNet提取的维度降达到4096维,如果直接用这4096维特征去做检索,必然会导致效率低下,运算量过高,这正是局部敏感哈希(LSH)所要解决的问题(LSH请参考以前的文章)。自然而然,我们可以讲CNN提取的特征按照LSH算法来进行检索,而进行二值映射的这一步,作者很巧妙的在CNN中完成了。允许我先贴上论文中的一副图
由
检索
在检索时,依然要对query image进行二值特征转换,利用转换后的二值向量进行选取相似的图像。再对这些图像进行进一步的相似度判别,获得更高质量的结果。文中提到了两中检索衡量方式:粗检索(
粗检索
粗检索的定义方式是计算query image和图的Hamming Distance,当计算结果小于提前设置的阈值时,则将图像作为最后检索的结果集中。不难看出,这种检索方式与设置的阈值有很大关系,当阈值设置过大,会引入一些相差很大的结果,而设置过小,又会忽略一些相差不大的结果。不过优势在于检索速度很快,因为只涉及到求取两个01向量对应位置不相同的值的个数问题,利用位运算即可完成。
精细检索
精细检测则是按照欧氏距离来计算图像之间的相似度的,首先计算出query image和桶内每张候选图像特征向量的欧式距离,然后进行排序,便能挑选出top
最后的总结
论文中的网络结构和ImageNet相差之处是在之前的网络的两个全连接层之间加入了一个隐含全连接层,这一层的作用就是将
参考文献
[1] http://www.iis.sinica.edu.tw/~kevinlin311.tw/cvprw15.pdf(原论文)
[2] http://blog.csdn.net/han_xiaoyang
- 图像检索系统《Deep Learning of Binary Hash Codes for Fast Image Retrieval》
- Deep Learning of Binary Hash Codes for Fast Image Retrieval
- Deep Learning of Binary Hash Codes for Fast Image Retrieval
- 图像检索系列一:Deep Learning of Binary Hash Codes for Fast Image Retrieval
- 图像检索系列一:Deep Learning of Binary Hash Codes for Fast Image Retrieval
- 快速图像检索(Deep Learning of Binary Hash Codes for Fast Image Retrieval)
- 基于deep learning的快速图像检索(Deep Learning of Binary Hash Codes for Fast Image Retrieval)
- 基于deep learning的快速图像检索(Deep Learning of Binary Hash Codes for Fast Image Retrieval)
- Deep Learning of Binary Hash Codes for Fast Image Retrieval 代码编译
- Deep Learning of Binary Hash Codes for Fast Image Retrieval (CVPRW15)
- Deep Learning of Binary Hash Codes for Fast Image Retrieval_CVPR2015
- paper: cvprw2015deep learning of binary hash for fast retrieval
- 图像检索--Deep Supervised Hashing for Fast Image Retrieval
- 图像检索系统 Image Retrieval Systems
- 图像检索系统技术路线Pipeline of our image retrieval system
- 深度学习用于基于内容的图像检索 Deep Learning for Content-Based Image Retrieval
- Deep Hashing for Compact Binary Codes Learning
- 基于神经网络的图像检索 Neural Codes for Image Retrieval
- sphinx增量索引和主索引来实现索引的实时更新
- dubbo+zookeeper,传输数据超时问题
- Laravel 5 性能优化
- 对于具体化的查询结果,不支持该方法
- BP神经网络:图片的分割和规范化:《Python》系列。
- 图像检索系统《Deep Learning of Binary Hash Codes for Fast Image Retrieval》
- big data Index
- 学习一策略模式(strategy)
- RESTful API 设计指南
- D
- 2.2.5—单链表—Remove Duplicates from Sorted List II
- Java元注解的实战应用-实体类注解封装(下)
- SSH整合
- 使用 VSCode 与 Xdebug 调试