如何抓取某音视频的互动数据

如何抓取某音视频的互动数据

闲来无事琢磨了一下某音的视频数据抓取,发现通过链接就能提取点赞、评论、收藏这些互动数据。分享给有同样兴趣的朋友,说不定能帮你省点时间。

具体实现方法

  1. 获取视频链接 随便找个某音视频,复制它的分享链接。注意要完整的链接,不能是那种简化过的短链接。

  2. 提取视频ID 链接里有一串特殊的字符就是视频ID,用正则表达式或者字符串处理方法把它单独提取出来。

  3. 构造API请求 观察平台的数据请求规律,构造一个能获取视频详情的请求。需要设置合适的请求头和参数。

  4. 解析返回数据 拿到返回的JSON数据后,找到点赞数、评论数和收藏数对应的字段。这些字段可能会变,需要定期检查更新。

    python 复制代码
     # 监听数据包
            try:
                driver.listen.start('aweme/v1/web/aweme/detail/')
            except Exception as e:
                print(f"启动监听时发生错误: {e}")
                return None
    
            # 访问网站
            try:
                driver.get(video_url)
            except Exception as e:
                print(f"访问网页时发生错误: {e}")
                return None
    
            # 定义一个变量来存储响应数据
            json_data = None
    
            # 定义一个事件来通知主线程数据包已接收
            data_received = threading.Event()
            stop_event = threading.Event()  # 新增:用于通知子线程停止运行
    
            def listen_for_response():
                nonlocal json_data
                try:
                    while not stop_event.is_set():  # 检查是否需要停止
                        resp = driver.listen.wait(timeout=wait_time)  # 使用从EVN中导入的wait_time
                        if resp:
                            json_data = resp.response.body
                            data_received.set()
                            break  # 收到数据后退出循环
                except Exception as e:
                    print(f"监听数据包时发生错误: {e}")
                    EimsErrorMessage.add_interaction_error_log(link_address, 'video类型视频,监听接口失败', public_ip)
                finally:
                    stop_event.set()  # 确保最终设置停止标志

注意事项

  • 请求频率别太高,容易被封
  • 数据字段可能会变,需要及时调整
  • 仅供学习交流,别用于商业用途
  • 只提供部分主要功能点代码,如需完整的,请私信

这个小小的探索还挺有意思的,虽然没什么实际用途,但能一窥平台的数据结构也是种乐趣。有兴趣的话可以自己试试看,说不定能发现更有意思的东西。

相关推荐
用户83562907805111 小时前
Python 操作 PDF 附件:添加、查看与管理指南
后端·python
宇宙之一粟19 小时前
乐企版式文件生成平台
java·后端·python
学测绘的小杨1 天前
CompassFusion:一个从 GNSS 到 GNSS/INS 组合导航的独立工程包
python
zzzzzz3102 天前
当产品经理说这个很简单:我用Python自动化处理奇葩需求的实战指南
python·pycharm·产品经理
雪隐2 天前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
兵慌码乱2 天前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot2 天前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
顾林海3 天前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱3 天前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
Caco_D3 天前
一行代码抓遍全网 20 个热榜!Aneiang.Pa 4.0 发布 — 极简 .NET 爬虫库
爬虫·.net