wget网站镜像下载
来源:互联网 发布:知不足然后能自反也 编辑:程序博客网 时间:2024/04/29 20:12
1、镜像方式下载整个网站
#wget -m http://www.example.com/
如果发现Not following http://www.example/a/ because robots.txt forbids it.Decided NOT to load it.
原来是robots.txt协议要求的,对于这种君子协议
#wget -m -e robots=off http://www.example.com/
另外有些网站也会禁止wget之类agent下载,我们也可以伪装一下,下面是一个比较完美的镜像大杀器语句:
#wget -m -e robots=off -U "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6″ "http://www.example.com/"
以上这种对url rewrite的网站是无用的。
2、下载目录
#wget -r -np -nd http://example.com/packages/
3、下载指定扩展名文件
#wget -r -np -nd --accept=iso http://example.com/centos-5/i386/
api
0 0
- wget网站镜像下载
- wget 下载镜像网站的软件
- wget 镜像网站
- wget命令镜像网站
- wget与制作网站镜像
- wget 下载整个网站
- wget下载整个网站
- wget下载整个网站
- wget下载整个网站
- wget下载网站
- wget 下载网站
- wget下载整个网站
- WGET下载一个网站
- linux利用wget命令备份网站(镜像拷贝)
- linux镜像下载网站
- 使用wget下载整个网站
- 用Wget下载整个网站
- wget下载网站的目录
- 一位ACMer过来人的心得
- 快速计算积分图
- 深度学习_caffe-ubuntu-GPU 配置环境(0)
- TCP/IP、Http、Socket的区别
- 设计模式四
- wget网站镜像下载
- BZOJ 1189: [HNOI2007]紧急疏散evacuate|网络流|二分答案
- 学习快速排序的坑里的若干扯淡
- win7 旗舰版 秘钥 联网激活
- Linux的基础知识之用户、组合权限(一)
- <LeetCode OJ> 58. Length of Last Word
- ios7状态栏一直保持黑底白字
- idea中maven的基本配置
- edX Ubuntu 12.04 64 bit Installation