难熬的几天

来源:互联网 发布:群智能算法及其应用 编辑:程序博客网 时间:2024/04/30 04:25

列举遇到的问题:

1、开机启动即报错,从网上搜查了良久,有类似病症的解决方案,可我照猫画虎还是不行。 

2、system.dll报的异常。这个异常出现在dr. wang给我的那个比较“豪华”的爬虫程序中,以前可以编译,刚刚换了条内存却怎么也不能运行了。

异常内容如下:

未处理的“System.InvalidOperationException”类型的异常出现在System.dll中。 其他信息:类别不存在。

在程序中是一个用于释放内存的语句报出来的。(因此我怀疑是不是内存的缘故)

3、玩warcraft3,调分辨率800*600就蓝屏(640和1024均没有问题),系统说是fatal error,是微软一个名叫ialmnt5.sys的文件有问题,犯了这个病就只能手动关掉电源再重启。(这个问题很欠,特别欠!)

4、现在我想说说有关爬虫的问题了。

dr. wang说上一个程序是不会保存图片的,叫我这次将整个页面都保存下来。后来我就一直在想,别人的程序里面也没有涉及到具体存储结构的函数啊?可他们的就有图片。在网上找到的内容大都说如何保存网页,也没提具体怎么存图片。后来经过大量比较我发现,老师给我的那个链接本身就有问题,我现在还不明白其中奥秘,但很显然,我那个程序是可以下载图片的,我试了试163、新浪这样的门户网站,结果图片是可以下载的。老师给的那个万方数据期刊的页面,我怀疑页面代码的规范性是导致不能下载图片、flash信息的拦路虎。而且我还发现有些加密链接和安全链接基本上爬不下来什么东西。而一些大型的门户网站就比较容易爬。很显然,程序现在这个样子,只能够应付一些简单格式的下载。对于互联网上的大多数各种花样的格式而言,这个程序还是显得力不从心,因而还是有很大的改进空间。所以下一步就是要想办法实现尝试下载各种链接。

今晚我将程序做了一点优化,将string 类型的uri替换喂Uri类型的uri,这样使得程序更加规范、得当,为以后程序改善提供了便利前提。由上,我打算用Host方法分离出主站来做一个目录结构来存储相关网页。以前那个程序可以运行的时候,我看了一下它下载的目录结构,似乎就是这个样子的。有不准确的地方,一点点改之~~

加油!