恶意程序检测系统(未完成稿)

来源:互联网 发布:网络上骰宝赢钱技巧 编辑:程序博客网 时间:2024/06/05 13:23

系统主要有这些模块:pyqt界面模块,scrapy爬虫模块,virustotal检测。



2015.12

首先登陆virustotal的官网,看了一下virustota的接口。知道里面有api,格式大概是request(url,data);有文件扫描模块。到时候可以直接调用。但是主要是爬虫不好实现。


整个系统的流程图是这样的:



scrapy的安装:

本来是想用linux的环境,后来发现坑比较多,改用了windows。

先要安装simplejson,后面要安装twisted(import twisted)


版本的问题:


安装好scrapy之后,尝试了一些github项目,有的可以直接运行了,有一个还是分布式项目因为没有安装redis也不能运行。


过了几天,找到了可以爬取博客的一个scrapy。(其实也就是百度出来最广的一个教程)


这个时候发现自己的项目就是提取出app的下载地址,只是先用爬虫爬出来,再用xpath提取出来。


这个时候就要开始了解XPATH,在w3c学习了一下,并慢慢调试,知道了XPATH的用法。



后面遇到一个问题,就是最开始爬是从列表里面爬,爬下来还只是url的集合,这个时候不知道使用scrapy如何下载所有的东西。

0 0
原创粉丝点击