利用Git和wget批量下载网页数据

一、Git的下载(参考文章

二. wget下载(网上很多链接)

三、git和wget结合使用

1.先建立一个文本,将代码写入文本(代码如下),将txt后缀改为sh(download_ssebop.sh)。将wget和.sh文件放在一个文件中(F:\PhD\Mult_year_ET\Ssebop)。然后在Ssebop中右击,点击open Git bash here.然后输入:./download_ssebop.sh。点击回车即可。我需要下载的数据网页链接为:https://edcintl.cr.usgs.gov/downloads/sciweb1/shared/fews/web/global/monthly/etav5/downloads/

bash 复制代码
#!/bin/bash

# 设置基本参数
base_url="https://edcintl.cr.usgs.gov/downloads/sciweb1/shared/fews/web/global/monthly/etav5/downloads/"
start_year=2003
end_year=2021
download_dir="./down"

# 创建下载目录(如果不存在)
mkdir -p "$download_dir"

# 遍历每一年和月,构建URL并调用wget进行下载到指定目录
for year in $(seq $start_year $end_year); do
    for month in $(seq -w 1 12); do # 使用-w选项确保月份是两位数
        filename="m${year}${month}.zip"
        url="${base_url}${filename}"
        echo "Downloading ${filename} from ${url}"

        # 使用wget下载文件到指定目录
        if F:/PhD/Mult_year_ET/Ssebop/wget --quiet --show-progress --progress=bar:force -P "$download_dir" "$url"; then
            echo "Successfully downloaded ${filename} into ${download_dir}."
        else
            echo "Failed to download ${filename}."
        fi
    done
done

以上就可以对网页数据进行批量下载!

长路漫漫...

唯有坚持...

相关推荐
服务端相声演员1 小时前
Hadoop管理页看不到任务的问题
大数据·linux·hadoop
CASAIM1 小时前
CASAIM与承光电子达成深度合作,三维扫描逆向建模技术助力车灯设计与制造向数字化与智能化转型
大数据·人工智能·制造
不爱学习的小枫2 小时前
Hive-优化(参数优化篇)
大数据·数据仓库·hive
不爱学习的小枫2 小时前
Hive-数据倾斜优化
大数据·数据仓库·hive
菠萝派爱跨境2 小时前
海外矩阵社媒该如何防关联,降低封号率?
大数据·线性代数·矩阵
enfan知产2 小时前
18类创新平台培育入库!长沙经开区2025年各类科技创新平台培育申报流程时间材料及申报条件
大数据·物联网
caihuayuan53 小时前
Golang的多团队协作开发
java·大数据·spring boot·后端·课程设计
*星星之火*3 小时前
【Flink银行反欺诈系统设计方案】2.风控规则表设计与Flink CEP结合
大数据·flink·flink反欺诈
永洪科技5 小时前
从厨电模范到数字先锋,看永洪科技如何助力方太集团开启数字新征程
大数据·数据分析·数据可视化·bi
ZStack开发者社区5 小时前
上海市闵行区数据局调研云轴科技ZStack,共探数智化转型新路径
大数据·人工智能·科技·云计算