频繁子图挖掘算法gSpan的实现
来源:互联网 发布:幼儿园淘宝节摊位海报 编辑:程序博客网 时间:2024/05/17 01:58
频繁子图挖掘算法gSpan的实现
项目地址:https://github.com/betterenvi/gSpan
gSpan算法简介
频繁子图挖掘是数据挖掘中一个非常广泛的应用。频繁子图挖掘是指从大量的图中挖掘出满足给定支持度的频繁子图,同时算法需要保证这些频繁图不能重复。频繁模式挖掘主要就是应用两种策略(这里不讨论基于垂直增长的方法)——Apriori和Growth。最早的AGM和FSG就分别实现了这两重策略的基本思想。gSpan是一个非常高效的算法,它利用dfs-code序列对搜索树进行编码,并且制定一系列比较规则,从而保证最后只得到序列“最小”的频繁图集合。
我用Python实现了面向无向图、有向图的GSpan,在实现时,参考了gboost,一个gSpan的C++实现。在挖掘无向图的频繁子图时,经过多轮比较,我的实现和gboost的输出一致。
当前(时间:2016-10-29),gboost还不支持有向图的频繁子图挖掘。在我的实现中,支持面向有向图的频繁子图挖掘,可以挖掘那些至少有一个点能够到达其他任一点的频繁子图,但是还没有全面测试过,正确性不敢保证。只在两个简单的数据集上,运行了数次,暂时还未发现错误。欢迎大家访问我的项目https://github.com/betterenvi/gSpan,如果能够帮忙看看面向有向图的挖掘是否正确,将十分感谢!
1 0
- gSpan 频繁子图挖掘算法的实现
- 频繁子图挖掘算法gSpan的实现
- gSpan频繁子图挖掘算法
- gSpan频繁子图挖掘算法
- 数据挖掘---频繁项集挖掘Apriori算法的C++实现
- C++---Apriori算法实现,频繁模式数据挖掘,最大频繁项集,闭频繁项集
- 数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现
- 数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现
- 数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现
- 数据挖掘--频繁集测试--Apriori算法--java实现
- 频繁模式挖掘apriori算法介绍及Java实现
- 频繁项集挖掘Apriori算法及其Python实现
- Apriori算法:频繁模式挖掘
- 频繁模式挖掘-Apriori算法
- 频繁模式挖掘 Apri算法
- 频繁项挖掘-Apriori算法
- 利用mahout自带的fpgrowth算法挖掘频繁模式
- 关联规则(association rule)挖掘与频繁项集挖掘算法Apriori Java实现
- 1 python 图像处理工具之 Pillow
- linux下secureCRT8.0.2和secureFX8.0.2的破解
- 百度网盘文件分享设置个性密码
- android学习3
- Java开发工具_Eclipse中如何写一个标准学生类及其测试
- 频繁子图挖掘算法gSpan的实现
- 16 - 10 - 30 命令行参数 ----------《c语言程序设计》
- arch linux gcc-multilib等32位兼容lib target not found 解决
- Hibernate查询技术之HQL语句
- 洛谷2409Y的积木(二分答案)
- 我围观了一场机器人的入室盗窃案件[文]
- android学习4
- 开发者应当了解的WebKit知识
- 企业站群需要注意的问题