拿下python软件制作

来源:互联网 发布:mysql5.7 内存优化 编辑:程序博客网 时间:2024/04/27 20:28

累的都写不动了。等有空还是要写细一些。

主要是Scrapy,Selenium,wxPython和Pyinstaller,连用,里面的各种细节。

https://git.coding.net/MichShell/JiraCrawl.git


2017-08-14:

仅从结构说说,首先项目抓取这块是下面的cRawlJira.py去完成的,然后后这个InterfaceJira.py是用来做界面的。cCrawlJira要用到InterfaceJira这个界面。界面选择用wxPython去做,原因就是看着貌似挺容易上手,而且一直没有python IDE,UI设计相当不方便。


接下来说说dump下来的东西先存csv后转xlsx,之后是相应计算,这个都靠pipeline.py去做了。看到close_spider里面的大段代码,依然很不爽,然而不打算再建立文件单独存放了。在这个文件里面写多两个个def是可以考虑的。我也嫌他不好看。然而先放一下吧,最近没有时间了。要记得在setting.py里面加入这个pipeline。

parserstrip.py在上面的cRawlJira.py有用到,为的是去掉那些innerHTML里面的"<",">","\t"或者"\n"这类的转义字符,超文本字符。

最后的run_spider.py就是用来做exe的。不过其实跨电脑使用,那些基础库还是都要装好的,不然这个exe也是跑不了的。


剩下就是老老实实堆代码...