一个由数据抓取引申的算法问题

来源:互联网 发布:c语言头文件在哪下载 编辑:程序博客网 时间:2024/04/30 09:41

最近有个MM要创业,她在茫茫网海中找客户资源, 太累, 要我帮他做一数据抓取的东东, 我一想, 如果是并发太多的请求的话,会被IIS屏蔽, 如果是按有规律的时间来抓取数据,很容易被网站的管理人员发觉,所以我想出一个主意. 就是在每个小时里面随机产生并按从小到大的顺序排序的N个数,这N个数之间任何两个数的间隔必须大于P(即网页的超时时间),  假设 N = 1000, P = 8, 那么

从 1 到 3600 里随机产生1000个整数,并按顺序排列,要求任何一个数减去该数的前一个数的差大于8.

 似乎没想出一个好的算法.我想了两个.发现效率都太低了.有个甚至程序挂了.

原创粉丝点击