wget命令是干嘛的,怎么用

wget命令是一个用于从网络上下载文件的命令行工具。它支持通过HTTP、HTTPS和FTP协议进行文件下载,并且可以递归下载整个网站。

以下是wget命令的基本用法和常用选项:

基本用法

sh 复制代码
wget [选项] [URL]

常用选项

  • -O [文件名]:将下载的文件保存为指定的文件名。
  • -c:断点续传,继续下载上次未完成的文件。
  • -r:递归下载。
  • -p:下载页面内所有资源(例如图片、CSS等),使得页面可以离线查看。
  • -k:将下载的HTML文件内的链接转换为本地链接。
  • -l [级别]:递归下载的级别。
  • --limit-rate=[速度]:限制下载速度。例如--limit-rate=200k表示限制下载速度为200KB/s。
  • -b:后台下载模式。
  • --user=[用户名] --password=[密码]:用于需要身份验证的站点。

示例

  1. 下载单个文件
sh 复制代码
wget http://example.com/file.zip
  1. 将文件保存为指定名称
sh 复制代码
wget -O myfile.zip http://example.com/file.zip
  1. 断点续传
sh 复制代码
wget -c http://example.com/file.zip
  1. 递归下载整个网站
sh 复制代码
wget -r http://example.com
  1. 下载页面及其资源
sh 复制代码
wget -p http://example.com
  1. 将下载的HTML文件内的链接转换为本地链接
sh 复制代码
wget -k -r http://example.com
  1. 后台下载并限制下载速度
sh 复制代码
wget -b --limit-rate=100k http://example.com/file.zip
  1. 下载需要身份验证的资源
sh 复制代码
wget --user=myusername --password=mypassword http://example.com/protected-file.zip

通过这些选项,wget可以非常灵活地用于各种下载任务。

wget 是一个命令行工具,通常在终端或命令行界面中运行,而不是在 Python 脚本中直接运行。不过,你可以在 Python 脚本中使用 subprocess 模块来调用 wget 命令。以下是如何在 Python 脚本中使用 wget 的示例:

使用 subprocess 调用 wget

python 复制代码
import subprocess

# 下载单个文件
url = "http://example.com/file.zip"
subprocess.run(["wget", url])

# 将文件保存为指定名称
output_filename = "myfile.zip"
subprocess.run(["wget", "-O", output_filename, url])

# 断点续传
subprocess.run(["wget", "-c", url])

# 递归下载整个网站
website_url = "http://example.com"
subprocess.run(["wget", "-r", website_url])

使用 requests 模块替代 wget

如果不想依赖外部工具,你也可以使用 Python 的 requests 模块来下载文件。以下是使用 requests 模块下载文件的示例:

python 复制代码
import requests

url = "http://example.com/file.zip"
output_filename = "file.zip"

response = requests.get(url, stream=True)
with open(output_filename, 'wb') as file:
    for chunk in response.iter_content(chunk_size=8192):
        if chunk:
            file.write(chunk)

安装 requests 模块

如果你还没有安装 requests 模块,可以使用 pip 来安装:

sh 复制代码
pip install requests

总结

尽管 wget 是一个强大的下载工具,但在 Python 脚本中通常使用 subprocess 模块来调用它。如果不想依赖外部工具,可以使用 requests 模块来实现类似的功能。两种方法各有优劣,可以根据具体需求选择合适的方式。

相关推荐
PyHaVolask7 分钟前
Python进阶教程:随机数、正则表达式与异常处理
python·正则表达式·异常处理·随机数生成
折翼的恶魔23 分钟前
数据分析:合并二
python·数据分析·pandas
三体世界3 小时前
测试用例全解析:从入门到精通(1)
linux·c语言·c++·python·功能测试·测试用例·测试覆盖率
Python私教3 小时前
Django全栈班v1.04 Python基础语法 20250912 下午
后端·python·django
xchenhao3 小时前
Scikit-Learn 对糖尿病数据集(回归任务)进行全面分析
python·机器学习·回归·数据集·scikit-learn·特征·svm
xchenhao3 小时前
Scikit-learn 对加州房价数据集(回归任务)进行全面分析
python·决策树·机器学习·回归·数据集·scikit-learn·knn
这里有鱼汤3 小时前
发现一个高性能回测框架,Python + Rust,比 backtrader 快 250 倍?小团队必备!
后端·python
☼←安于亥时→❦3 小时前
数据分析之Pandas入门小结
python·pandas
带娃的IT创业者3 小时前
《Python Web部署应知应会》No3:Flask网站的性能优化和实时监测深度实战
前端·python·flask
赴3354 小时前
图像拼接案例,抠图案例
人工智能·python·计算机视觉