`
longgangbai
  • 浏览: 7246677 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Linux中一个支持HTTP和FTP下载的命令wget详解

阅读更多

Wget     Wget是一个十分常用命令行下载工具,多数Linux发行版本都默认包含这个工具。如果没有安装可在http://www.gnu.org/software/wget/wget.html下载最新版本,并使用如下命令编译安装:
    #tar zxvf wget-1.9.1.tar.gz
    #cd wget-1.9.1

    #./configure
    #make

    #make install
它的用法很简单,Wget使用格式如下:

 #wget [选项] [下载地址]

1.Wget常用参数

◆-b:后台下载,Wget默认的是把文件下载到当前目录。

 ◆-O:将文件下载到指定的目录中。

◆-P:保存文件之前先创建指定名称的目录。

◆-t:尝试连接次数,当Wget无法与服务器建立连接时,尝试连接多少次。

◆-c:断点续传,如果下载中断,那么连接恢复时会从上次断点开始下载。    

 除了上述常用功能,Wget还支持HTTP和FTP代理功能,编辑其配置文件“/etc/wgetrc”即可。具体方法是使用VI编辑器打开上述文件,将 “http_proxy”和“ftp_proxoy”前的#去掉,然后在这两项后输入相应的代理服务器的地址,保存退出即可。此外,Wget还可下载整个网站,如下载http://man.chinaunix.net整个Man手册中心。只需输入如下命令即可: #wget -r -p -np -k http://man.chinaunix.net 其中-r参数是指使用递归下载,-p是指下载所有显示完整网页所以需要的文件,如图片等,-np是指不搜索上层目录,-k则是指将绝对链接转换为相对链接。

  •  

    $ wget -r -np -nd http://example.com/packages/

     

 

这条命令可以下载 http://example.com 网站上 packages 目录中的所有文件。其中,

-np

的作用是不遍历父目录,

-nd

表示不在本机重新创建目录结构。

  •  

    $ wget -r -np -nd --accept=iso http://example.com/centos-5/i386/

     

 

与上一条命令相似,但多加了一个

--accept=iso

选项,这指示 wget 仅下载 i386 目录中所有扩展名为 iso 的文件。你也可以指定多个扩展名,只需用逗号分隔即可。

  •  

    $ wget -i filename.txt

     

 

此命令常用于批量下载的情形,把所有需要下载文件的地址放到 filename.txt 中,然后 wget 就会自动为你下载所有文件了。

  •  

    $ wget -c http://example.com/really-big-file.iso

     

 

这里所指定的

-c

选项的作用为断点续传。

  •  

    $ wget -m -k (-H) http://www.example.com/

     

 

该命令可用来镜像一个网站,wget 将对链接进行转换。如果网站中的图像是放在另外的站点,那么可以使用

-H

选项。

        --cookies=off 禁用 cookie。

 

  --load-cookies=文件 会话开始前由指定文件载入 cookie。

  --save-cookies=文  件 会话结束后将 cookie 保存至指定文件。

  --post-data=字符串 使用 POST 方法,发送指定字符串。

  --post-file=文件 使用 POST 方法,发送指定文件中的内容。

  HTTPS (SSL) 选项:

  --sslcertfile=文件 可选的客户段端证书。

  --sslcertkey=密钥文件 对此证书可选的“密钥文件”。

  --egd-file=文件 EGD socket 文件名。

  --sslcadir=目录 CA 散列表所在的目录。

  --sslcafile=文件 包含 CA 的文件。

  --sslcerttype=0/1 Client-Cert 类型 0=PEM (默认) / 1=ASN1 (DER)

  --sslcheckcert=0/1 根据提供的 CA 检查服务器的证书

  --sslprotocol=0-3 选择 SSL 协议;0=自动选择,

  1=SSLv2 2=SSLv3 3=TLSv1

  FTP 选项:

  -nr, --dont-remove-listing 不删除“.listing”文件。

  -g, --glob=on/off 设置是否展开有通配符的文件名。

  --passive-ftp 使用“被动”传输模式。

  --retr-symlinks 在递归模式中,下载链接所指示的文件(连至目录

  则例外)。

  递归下载:

  -r, --recursive 递归下载。

  -l, --level=数字 最大递归深度(inf 或 0 表示无限)。

  --delete-after 删除下载后的文件。

  -k, --convert-links 将绝对链接转换为相对链接。

  -K, --backup-converted 转换文件 X 前先将其备份为 X.orig。

  -m, --mirror 等效于 -r -N -l inf -nr 的选项。

  -p, --page-requisites 下载所有显示完整网页所需的文件,例如图像。

 

  --strict-comments 打开对 HTML 备注的严格(SGML)处理选项。

  递归下载时有关接受/拒绝的选项:

  -A, --accept=列表 接受的文件样式列表,以逗号分隔。

  -R, --reject=列表 排除的文件样式列表,以逗号分隔。

  -D, --domains=列表 接受的域列表,以逗号分隔。

  --exclude-domains=列表 排除的域列表,以逗号分隔。

  --follow-ftp 跟随 HTML 文件中的 FTP 链接。

  --follow-tags=列表 要跟随的 HTML 标记,以逗号分隔。

  -G, --ignore-tags=列表 要忽略的 HTML 标记,以逗号分隔。

  -H, --span-hosts 递归时可进入其它主机。

  -L, --relative 只跟随相对链接。

  -I, --include-directories=列表 要下载的目录列表。

  -X, --exclude-directories=列表 要排除的目录列表。

  -np, --no-parent 不搜索上层目录。

 

 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics