快速无需脚本直接用迅雷下载页面全部链接

来源：互联网发布：python的数据类型编辑：程序博客网时间：2024/05/16 19:24

工具准备：

1. chrome 浏览器（或者其他可以按F12打开源代码）

2. atom 编辑器（一款带正则匹配搜索的编辑器，github发布，无比顺手）

3. 了解基本的正则表达式

开始：

1. 案例是下载https://web.stanford.edu/~jurafsky/NLPCourseraSlides.html

内所有的ppt和pdf文件

2. 按F12 可以发现整个网页的框架，在源代码窗口内移动鼠标，网页页面会高亮显示对应的内容。

可以看到，table border 整一块对应了所有的下载链接的HTML代码

3. 右键该层HTML -> copy -> copy to outerHTML, atom打开后随便新建文档，黏贴到文档，可以看到一层层的html代码

4. atom下，按ctrl +F 搜索，搜索栏右边点击 ".*" 启动正则匹配

5. 此时打开迅雷，在搜索栏写入

http.*?.pdf

解释：. 句号代表匹配任意的一个字符，*代表句号匹配的个数是任意多个，？代表非贪婪匹配，只要遇到.pdf就直接停止匹配

http.*?.pptx
匹配ppt, 其他内容也是相似的方式，因为下载链接都是文件后缀名结尾，如下载页面内全部视频 flv mp4 替换表达式的pdf即可

6.点击find all, ctrl + c ，接着开着的迅雷就会自动识别你的复制栏，然后下载全部内容

0 0