wget命令是干嘛的,怎么用

wget命令是一个用于从网络上下载文件的命令行工具。它支持通过HTTP、HTTPS和FTP协议进行文件下载,并且可以递归下载整个网站。

以下是wget命令的基本用法和常用选项:

基本用法

sh 复制代码
wget [选项] [URL]

常用选项

  • -O [文件名]:将下载的文件保存为指定的文件名。
  • -c:断点续传,继续下载上次未完成的文件。
  • -r:递归下载。
  • -p:下载页面内所有资源(例如图片、CSS等),使得页面可以离线查看。
  • -k:将下载的HTML文件内的链接转换为本地链接。
  • -l [级别]:递归下载的级别。
  • --limit-rate=[速度]:限制下载速度。例如--limit-rate=200k表示限制下载速度为200KB/s。
  • -b:后台下载模式。
  • --user=[用户名] --password=[密码]:用于需要身份验证的站点。

示例

  1. 下载单个文件
sh 复制代码
wget http://example.com/file.zip
  1. 将文件保存为指定名称
sh 复制代码
wget -O myfile.zip http://example.com/file.zip
  1. 断点续传
sh 复制代码
wget -c http://example.com/file.zip
  1. 递归下载整个网站
sh 复制代码
wget -r http://example.com
  1. 下载页面及其资源
sh 复制代码
wget -p http://example.com
  1. 将下载的HTML文件内的链接转换为本地链接
sh 复制代码
wget -k -r http://example.com
  1. 后台下载并限制下载速度
sh 复制代码
wget -b --limit-rate=100k http://example.com/file.zip
  1. 下载需要身份验证的资源
sh 复制代码
wget --user=myusername --password=mypassword http://example.com/protected-file.zip

通过这些选项,wget可以非常灵活地用于各种下载任务。

wget 是一个命令行工具,通常在终端或命令行界面中运行,而不是在 Python 脚本中直接运行。不过,你可以在 Python 脚本中使用 subprocess 模块来调用 wget 命令。以下是如何在 Python 脚本中使用 wget 的示例:

使用 subprocess 调用 wget

python 复制代码
import subprocess

# 下载单个文件
url = "http://example.com/file.zip"
subprocess.run(["wget", url])

# 将文件保存为指定名称
output_filename = "myfile.zip"
subprocess.run(["wget", "-O", output_filename, url])

# 断点续传
subprocess.run(["wget", "-c", url])

# 递归下载整个网站
website_url = "http://example.com"
subprocess.run(["wget", "-r", website_url])

使用 requests 模块替代 wget

如果不想依赖外部工具,你也可以使用 Python 的 requests 模块来下载文件。以下是使用 requests 模块下载文件的示例:

python 复制代码
import requests

url = "http://example.com/file.zip"
output_filename = "file.zip"

response = requests.get(url, stream=True)
with open(output_filename, 'wb') as file:
    for chunk in response.iter_content(chunk_size=8192):
        if chunk:
            file.write(chunk)

安装 requests 模块

如果你还没有安装 requests 模块,可以使用 pip 来安装:

sh 复制代码
pip install requests

总结

尽管 wget 是一个强大的下载工具,但在 Python 脚本中通常使用 subprocess 模块来调用它。如果不想依赖外部工具,可以使用 requests 模块来实现类似的功能。两种方法各有优劣,可以根据具体需求选择合适的方式。

相关推荐
巴里巴气1 小时前
selenium基础知识 和 模拟登录selenium版本
爬虫·python·selenium·爬虫模拟登录
19891 小时前
【零基础学AI】第26讲:循环神经网络(RNN)与LSTM - 文本生成
人工智能·python·rnn·神经网络·机器学习·tensorflow·lstm
JavaEdge在掘金1 小时前
Redis 数据倾斜?别慌!从成因到解决方案,一文帮你搞定
python
ansurfen1 小时前
我的第一个AI项目:从零搭建RAG知识库的踩坑之旅
python·llm
前端付豪1 小时前
20、用 Python + API 打造终端天气预报工具(支持城市查询、天气图标、美化输出🧊
后端·python
前端付豪1 小时前
19、用 Python + OpenAI 构建一个命令行 AI 问答助手
后端·python
amazinging2 小时前
北京-4年功能测试2年空窗-报培训班学测开-第四十三天
python·学习
wgyang20162 小时前
我的第一个LangFlow工作流——复读机
python
Zhen (Evan) Wang3 小时前
(豆包)xgb.XGBRegressor 如何进行参数调优
开发语言·python
我爱一条柴ya3 小时前
【AI大模型】线性回归:经典算法的深度解析与实战指南
人工智能·python·算法·ai·ai编程