基于云部署DeepSeek自动分析整合Dou音爆款视频数据

大家好,我是小黄。

上期我们介绍了基于云部署的deepseek自动分析整合xiaoHongShu的低粉爆款视频数据。那么很多小伙伴都来问我能不能出一个Dou音版本的。Dou音因为他的反爬做得比较好,所以小黄现在还没有获取到粉丝数量的功能。

我们先看看效果。我们根据控制台的输出调试可以看出,作品和作者的数据基本一致。

因为近段时间的DeepSeek的官网还是很容易繁忙,所以我们今天老样子,还是使用自己部署到云平台的deepSeek来实现。

一.注册登录云平台

1.填写注册的基本信息后登录云平台

平台直达:https://cloud.lanyun.net/#/registerPage?promoterCode=490396da6b

2.点击选择应用市场。
3.选择对应的DeepSeek模型。
4.选择模型对应的显卡配置
5.成功部署后启动应用

之后我们就可以正常询问了:

我们本次需要使用到篡改猴插件。

大家不会安装的可以自行搜索安装一下,我们本次重点介绍采集的脚本。

我们基于某dou音的数据采集,效果如下:在页面友上角创建一个按钮,采集完成的数据会生成一个excel表格。我们可以根据表格快速找到我们想要参考的数据。

最终部分脚本:完整的脚本大家可以关注小黄回复:dou音爆款获取

主要逻辑:我们通过油猴脚本去获取作品超过50000点赞的爆款视频,并把符合条件的视频数据导出,包括作者,作品的点赞数量,作品的连接等。

// ==UserScript==
// @name         抖音低粉爆款视频采集
// @namespace    http://tampermonkey.net/
// @version      1.6
// @description  点击按钮采集抖音点赞数大于50000视频数据,支持超时检测和错误处理
// @author       XiaoHuangCodeing
// @match        https://www.douyin.com/*
// @grant        GM_xmlhttpRequest
// @grant        GM_addStyle
// @require      https://cdn.jsdelivr.net/npm/xlsx@0.18.5/dist/xlsx.full.min.js
// ==/UserScript==

(function () {
    'use strict';

    // 存储采集到的视频数据
    let videoData = [];
    // 存储符合条件到的视频数据
    let targetData = [];
    // 存储粉丝数据
    let fansData = [];

    let exportout = false; // 是否导出数据
    // 定义筛选条件
    const MIN_LIKES = 500000; // 最小点赞数
    const MAX_FOLLOWERS = 3000; // 最大粉丝数未成功
    const MAX_NUM = 40; // 最大采集数量
    let seratchNum = 0; // 采集数量

    // 定义超时时间(单位:毫秒)
    const TIMEOUT_DURATION = 10000; // 10 秒

    // 添加按钮样式
    GM_addStyle(`
        #collect-button {
            position: fixed;
            top: 20px;
            right: 20px;
            z-index: 1000;
            padding: 10px 20px;
            background-color: #ff2442;
            color: white;
            border: none;
            border-radius: 5px;
            cursor: pointer;
            font-size: 14px;
        }
        #collect-button:hover {
            background-color: #e0213a;
        }
    `);

    // 添加按钮到页面
    const button = document.createElement('button');
    button.id = 'collect-button';
    button.innerText = '开始采集';
    document.body.appendChild(button);

    // 按钮点击事件
    button.addEventListener('click', () => {
        button.innerText = '采集中...';
        button.disabled = true;
        exportout = true;
        videoData = []; // 重置数据
        targetData = [];
        fansData = [];
        seratchNum = 0;
        getVideoInfo();
        setTimeout(() => {
            if (videoData.some(item => item.粉丝数 === '加载中...')) {
                console.log('采集超时,导出已采集的数据');
                exportToExcel(targetData);
                button.innerText = '开始采集';
                button.disabled = false;
            }
        }, TIMEOUT_DURATION);
    });

    // 获取视频信息
    function getVideoInfo() {
        const videoItems = document.querySelectorAll('.Xyhun5Yc'); // 获取所有视频项

        videoItems.forEach((video, index) => {
            const title = video.querySelector('.bWzvoR9D')?.innerText || '未知标题'; // 标题
            const author = video.querySelector('.i1udsuGn')?.innerText || '未知作者'; // 作者
            const likesText = video.querySelector('.x7P__y2r span:nth-child(2)')?.innerText || '0'; // 点赞数文本(第二个 span)
            const likes = parseCount(likesText); // 解析点赞数
            const cover = video.querySelector('.DSeU7aaq')?.style.backgroundImage.replace(/url\(['"]?(.*?)['"]?\)/, '$1') || '未知封面'; // 封面图链接
            const link = video.querySelector('a')?.href || '未知链接'; // 视频链接
            const authorLink = video.querySelector('.uz1VJwFY')?.href || '未知作者链接'; // 作者主页链接

            // 将数据存储到数组中
            videoData.push({
                标题: title,
                作者: author,
                点赞数: likes,
                封面图: cover,
                链接: link,
                作者主页: authorLink,
                粉丝数: '加载中...' // 初始占位符
            });

            // 获取粉丝数
            if (authorLink && authorLink !== '未知作者链接') {
                getFollowerCount(authorLink, index);
            }
        });

        // 如果没有视频数据
        if (videoData.length === 0) {
            alert('未找到视频数据');
            button.innerText = '开始采集';
            button.disabled = false;
        }
    }

导出excel效果:

好了,今天的分享就到这里了,认知易,行动难,大家快去体验一下吧!体验网址: https://cloud.lanyun.net/#/registerPage?promoterCode=490396da6b

相关推荐
tzc_fly6 分钟前
scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库
人工智能
江苏学蠡信息科技有限公司30 分钟前
基于RKNN的嵌入式深度学习开发(2)
人工智能·深度学习
轶软工作室36 分钟前
全自动数据强制备份程序,无视占用直接硬复制各种数据文件、文档、音视频、软件、数据库等的VSS卷拷贝批处理脚本程序,解放双手,一劳永逸
数据库·音视频
wkd_00742 分钟前
【音视频 | AAC】AAC解码库faad2介绍、使用步骤、例子代码
音视频·aac·faad·faad2·aac解码·aac解码库
摸鱼 特供版43 分钟前
一键无损放大视频,让老旧画面重焕新生!
windows·学习·音视频·软件需求
敢嗣先锋1 小时前
鸿蒙5.0实战案例:基于OpenGL渲染视频画面帧
移动开发·音视频·harmonyos·arkts·opengl·arkui·鸿蒙开发
gma9991 小时前
【音视频】RTP封包H265信息
音视频
量子-Alex1 小时前
【多模态目标检测】M2FNet:基于可见光与热红外图像的多模态融合目标检测网络
人工智能·目标检测·计算机视觉
IT从业者张某某1 小时前
深入探索像ChatGPT这样的大语言模型-03-POST-Training:Reinforcement Learning
人工智能·语言模型·chatgpt
量子-Alex1 小时前
【CVPR 2024】【多模态目标检测】SHIP 探究红外与可见光图像融合中的高阶协同交互
人工智能·目标检测·计算机视觉