基于云部署DeepSeek自动分析整合Dou音爆款视频数据

大家好,我是小黄。

上期我们介绍了基于云部署的deepseek自动分析整合xiaoHongShu的低粉爆款视频数据。那么很多小伙伴都来问我能不能出一个Dou音版本的。Dou音因为他的反爬做得比较好,所以小黄现在还没有获取到粉丝数量的功能。

我们先看看效果。我们根据控制台的输出调试可以看出,作品和作者的数据基本一致。

因为近段时间的DeepSeek的官网还是很容易繁忙,所以我们今天老样子,还是使用自己部署到云平台的deepSeek来实现。

一.注册登录云平台

1.填写注册的基本信息后登录云平台

平台直达:https://cloud.lanyun.net/#/registerPage?promoterCode=490396da6b

2.点击选择应用市场。
3.选择对应的DeepSeek模型。
4.选择模型对应的显卡配置
5.成功部署后启动应用

之后我们就可以正常询问了:

我们本次需要使用到篡改猴插件。

大家不会安装的可以自行搜索安装一下,我们本次重点介绍采集的脚本。

我们基于某dou音的数据采集,效果如下:在页面友上角创建一个按钮,采集完成的数据会生成一个excel表格。我们可以根据表格快速找到我们想要参考的数据。

最终部分脚本:完整的脚本大家可以关注小黄回复:dou音爆款获取

主要逻辑:我们通过油猴脚本去获取作品超过50000点赞的爆款视频,并把符合条件的视频数据导出,包括作者,作品的点赞数量,作品的连接等。

复制代码
// ==UserScript==
// @name         抖音低粉爆款视频采集
// @namespace    http://tampermonkey.net/
// @version      1.6
// @description  点击按钮采集抖音点赞数大于50000视频数据,支持超时检测和错误处理
// @author       XiaoHuangCodeing
// @match        https://www.douyin.com/*
// @grant        GM_xmlhttpRequest
// @grant        GM_addStyle
// @require      https://cdn.jsdelivr.net/npm/[email protected]/dist/xlsx.full.min.js
// ==/UserScript==

(function () {
    'use strict';

    // 存储采集到的视频数据
    let videoData = [];
    // 存储符合条件到的视频数据
    let targetData = [];
    // 存储粉丝数据
    let fansData = [];

    let exportout = false; // 是否导出数据
    // 定义筛选条件
    const MIN_LIKES = 500000; // 最小点赞数
    const MAX_FOLLOWERS = 3000; // 最大粉丝数未成功
    const MAX_NUM = 40; // 最大采集数量
    let seratchNum = 0; // 采集数量

    // 定义超时时间(单位:毫秒)
    const TIMEOUT_DURATION = 10000; // 10 秒

    // 添加按钮样式
    GM_addStyle(`
        #collect-button {
            position: fixed;
            top: 20px;
            right: 20px;
            z-index: 1000;
            padding: 10px 20px;
            background-color: #ff2442;
            color: white;
            border: none;
            border-radius: 5px;
            cursor: pointer;
            font-size: 14px;
        }
        #collect-button:hover {
            background-color: #e0213a;
        }
    `);

    // 添加按钮到页面
    const button = document.createElement('button');
    button.id = 'collect-button';
    button.innerText = '开始采集';
    document.body.appendChild(button);

    // 按钮点击事件
    button.addEventListener('click', () => {
        button.innerText = '采集中...';
        button.disabled = true;
        exportout = true;
        videoData = []; // 重置数据
        targetData = [];
        fansData = [];
        seratchNum = 0;
        getVideoInfo();
        setTimeout(() => {
            if (videoData.some(item => item.粉丝数 === '加载中...')) {
                console.log('采集超时,导出已采集的数据');
                exportToExcel(targetData);
                button.innerText = '开始采集';
                button.disabled = false;
            }
        }, TIMEOUT_DURATION);
    });

    // 获取视频信息
    function getVideoInfo() {
        const videoItems = document.querySelectorAll('.Xyhun5Yc'); // 获取所有视频项

        videoItems.forEach((video, index) => {
            const title = video.querySelector('.bWzvoR9D')?.innerText || '未知标题'; // 标题
            const author = video.querySelector('.i1udsuGn')?.innerText || '未知作者'; // 作者
            const likesText = video.querySelector('.x7P__y2r span:nth-child(2)')?.innerText || '0'; // 点赞数文本(第二个 span)
            const likes = parseCount(likesText); // 解析点赞数
            const cover = video.querySelector('.DSeU7aaq')?.style.backgroundImage.replace(/url\(['"]?(.*?)['"]?\)/, '$1') || '未知封面'; // 封面图链接
            const link = video.querySelector('a')?.href || '未知链接'; // 视频链接
            const authorLink = video.querySelector('.uz1VJwFY')?.href || '未知作者链接'; // 作者主页链接

            // 将数据存储到数组中
            videoData.push({
                标题: title,
                作者: author,
                点赞数: likes,
                封面图: cover,
                链接: link,
                作者主页: authorLink,
                粉丝数: '加载中...' // 初始占位符
            });

            // 获取粉丝数
            if (authorLink && authorLink !== '未知作者链接') {
                getFollowerCount(authorLink, index);
            }
        });

        // 如果没有视频数据
        if (videoData.length === 0) {
            alert('未找到视频数据');
            button.innerText = '开始采集';
            button.disabled = false;
        }
    }

导出excel效果:

好了,今天的分享就到这里了,认知易,行动难,大家快去体验一下吧!体验网址: https://cloud.lanyun.net/#/registerPage?promoterCode=490396da6b

相关推荐
寻丶幽风4 小时前
论文阅读笔记——双流网络
论文阅读·笔记·深度学习·视频理解·双流网络
CM莫问5 小时前
<论文>(微软)避免推荐域外物品:基于LLM的受限生成式推荐
人工智能·算法·大模型·推荐算法·受限生成
康谋自动驾驶6 小时前
康谋分享 | 自动驾驶仿真进入“标准时代”:aiSim全面对接ASAM OpenX
人工智能·科技·算法·机器学习·自动驾驶·汽车
深蓝学院7 小时前
密西根大学新作——LightEMMA:自动驾驶中轻量级端到端多模态模型
人工智能·机器学习·自动驾驶
归去_来兮8 小时前
人工神经网络(ANN)模型
人工智能·机器学习·人工神经网络
2201_754918418 小时前
深入理解卷积神经网络:从基础原理到实战应用
人工智能·神经网络·cnn
强盛小灵通专卖员8 小时前
DL00219-基于深度学习的水稻病害检测系统含源码
人工智能·深度学习·水稻病害
Luke Ewin8 小时前
CentOS7.9部署FunASR实时语音识别接口 | 部署商用级别实时语音识别接口FunASR
人工智能·语音识别·实时语音识别·商用级别实时语音识别
白熊1888 小时前
【计算机视觉】OpenCV实战项目:Face-Mask-Detection 项目深度解析:基于深度学习的口罩检测系统
深度学习·opencv·计算机视觉
Joern-Lee8 小时前
初探机器学习与深度学习
人工智能·深度学习·机器学习