Method级别的缺陷数据集

来源:互联网 发布:苹果软件打不开要信任 编辑:程序博客网 时间:2024/06/04 00:23

这篇博客也就简单总结一下。

前段时间扫论文的时候看到了这篇文章:

Shippey, Thomas, et al. "So You Need More Method Level Datasets for Your Software Defect Prediction?: Voilà!." Proceedings of the 10th ACM/IEEE International Symposium on Empirical Software Engineering and Measurement. ACM, 2016.

发表在16年的ESEM上,据作者介绍,他们在50000个SourceForge上的开源软件中,选择了23个软件系统构造数据集,并用SZZ算法(Zeller他们提的算法)构造了数据集。这个数据集本身的链接在这里:http://www.elff.org.uk/research/data_tools/esem2016/,但我访问的时候竟然需要FQ,看到作者将数据集在Github上公布了:https://github.com/tjshippey/ESEM2016。这也算是对缺陷预测研究领域的一项重要贡献了。下载下来简单看了一下,例如jedit 5.2的一条记录如下:


具体内容大家可以自己看看,就先简单总结这么多。