nodejs写爬虫

javascript 复制代码
const axios = require('axios');
const fs = require('fs');
const path = require('path');
const cheerio = require('cheerio');
const { str } = require('./dataStr');


async function getImageUrls() {
    const $ = cheerio.load(str)
    let imageUrls = [];
    $('img').each((index, element) => {
        const imgSrc = $(element).attr('src'); // 获取每张图片的源地址
        if (/^https/.test(imgSrc)) { // 判断是否为外部图片
            imageUrls.push(imgSrc);
        } else if (/^\//.test(imgSrc)) { // 判断是否为相对路径
            imageUrls.push(`https:${imgSrc}`);
        }
    });
    return imageUrls;
}

const sleep = time => {
    return new Promise(function (resolve, reject) {
        setTimeout(function () {
            resolve();
        }, time);
    })
}

async function test() {
    try {
        const urls = await getImageUrls();
        console.log('urls', urls)
        if (urls !== null) {
            for (let i = 0; i < urls.length; i++) {
                const fileName = `image_${i}.gif`; // 自定义保存图片的名称及格式
                const filePath = path.join('./images2', fileName); // 构造本地保存路径
                await sleep(1500)
                try {
                    const response = await axios({
                        method: 'get',
                        url: urls[i],
                        responseType: 'stream' // 流式传输图片数据
                    });

                    response.data.pipe(fs.createWriteStream(filePath)); // 将图片数据写入本地文件
                    console.log(`Successfully downloaded ${fileName}`);
                } catch (error) {
                    console.log(`Failed to download ${fileName}: ${error}`);
                }
            }
        }
    } catch (error) {
        console.log(error);
    }
}

test();
相关推荐
weedsfly4 小时前
还在用 Axios?你可能需要重新理解 XHR 与 Fetch
前端·javascript·面试
CoderWeen4 小时前
从零实现一个 Vue3 流程图编辑器:节点拖拽、贝塞尔连线与框选
前端·javascript
To_OC14 小时前
LC 128 最长连续序列:别上来就排序,O (n) 解法才是这题的灵魂
javascript·算法·leetcode
kyriewen19 小时前
我用 50 行代码重写了 React Router 核心,终于搞懂了前端路由原理
前端·javascript·react.js
Asize21 小时前
HTML5 Canvas 基础:从按帧动画到 ECharts 数据可视化
前端·javascript·canvas
默_笙21 小时前
🎄 后端给我一堆扁平数据,我 10 行代码把它变成了树
前端·javascript
前端Hardy21 小时前
又一个 AI 神器火了!
前端·javascript·后端
PBitW1 天前
GPT训练我的第二天,我表示不过如此!!!😕😕😕
前端·javascript·面试
kyriewen1 天前
白宫直接给 OpenAI 下了限制令,GPT-5.6 不能随便放出来了
前端·javascript·面试
默_笙1 天前
🍞 我用 CSS 画了一个会转的 3D 立方体,同事以为我学了 Three.js(这节课真的很神奇,我很喜欢)
javascript