FG-Index: Towards Verification-Free Query Processing on Graph Databases
来源:互联网 发布:西北师范大学知行 编辑:程序博客网 时间:2024/06/07 18:42
简介
这篇paper是香港中文大学James Cheng 郑老师发在sigmod 2007上的一篇paper。这篇paper主要用频繁子图来建索引,来加速图同构算法。
众所周知,图数据的查询因为涉及到子图同构的问题(NPC),所以非常消耗时间。图同构常见的步骤都是生成候选集合(candidate set)将不可能入选结果集的结果过滤掉,第二部就是对候选集合进行验证。
假设现在存在一组频繁子图FG(Frequent subGraph),如果查询图是FG当中的一个元素,那么FG-index就可以直接把对应的结果返回给用户。如果查询不存在FG当中,那么FG-index会给出一个跟正确结果很相近的候选集合,那么这样的验证也相应的可以减少很多。
为了可以让索引载入到内存当中,文章中提出了δ-Tolerance Closed Frequent Graphs。可以调整索引的大小。
背景
- 图同构两大步骤:过滤=>验证
- 频繁出现的图意味着过滤以后的候选集合会非常大,那么就需要验证很多的候选结果。
- 较少出现的图意味着利用FG-index可以返回基本和结果一样的候选集合。
- 需要解决的一个问题是,如果选定的阈值太小δ,那么index将会太大。这也是文章想解决的一个问题。
问题定义
子图同构(subgraph isomorphism)。可自行查阅wiki或者原文。
文章基于无向带标签连通图。有向图可在下述方法中做扩展。
基本定义
- 图频率 给定一个图数据库D,给定一个图g,所有g’满足g是g’的子图,g’是D中的一个元素,这样g’的数量表示g的频率。直观来讲就是g是D中多少个图的子图。计作freq(g).
- 频繁子图 用户给定σ,当一个图g的freq(g)大于σ时,那么就称g是一个频繁子图。
- 最大频繁子图MFG 对于一个频繁子图的集合F,对于F中的一个元素g,不存在其他的元素g’是g的超图,那么g是F当中的一个MFG。
- 闭频繁子图CFG 对于一个频繁子图的集合F,对于F中的一个元素g,不存在g’是g的超图,并且freq(g’)=freq(g),那么我们称g是F的一个CFG。
#
======To be continue=========
1 0
- FG-Index: Towards Verification-Free Query Processing on Graph Databases
- HDU 4677 Query on Graph
- hdu 4677 Query on Graph
- HDOJ 4677 Query on Graph
- hdu4677 Query on Graph 根号n
- 【HDU】4677 Query on Graph 动态树
- A Simple Review Of 《Query Languages for Graph Databases》(I)
- A Simple Review Of 《Query Languages for Graph Databases》(II)
- A Simple Review Of 《Query Languages for Graph Databases》(III)
- 《EAGRE: Towards scalable I/O efficient SPARQL query evaluation on the cloud》——论文笔记
- query graph
- HDU-5957 Query on a graph(线段树+树剖)
- Query on a graph HDU5957 沈阳ICPC重现赛
- HDU 4677 Query on Graph 并查集+分块
- [bfs序 线段树] HDU5957. Query on a graph
- Graph Databases—Chapter 5 Graph Databases 阅读笔记
- DB2数据库查询过程(Query Processing)----多索引访问(Multiple Index Access)
- 《Efficient Batch Processing for Multiple Keyword Queries on Graph Data》——论文笔记
- 欢迎使用CSDN-markdown编辑器
- Python爬虫
- Unity 一些实用的代码
- [杂] -- yii2查看sql语句
- Matlab使用过程中内存不足问题的总结
- FG-Index: Towards Verification-Free Query Processing on Graph Databases
- 【九度】题目1023:EXCEL排序
- caffe学习系列:训练自己的图片集(超详细教程)
- Android 通过WiFi进行ADB调试
- 78 leetcode - Remove Duplicates from Sorted List
- Tree树(设置单击选中与取消多选框)(设置树节点隐藏)
- input子系统三 核心层和处理器注册
- 几个有用的blog链接
- 移动客户端中高效使用SQLite