【temu】分析拼多多跨境电商Temu数据分析数据采集

Temu是拼多多旗下跨境电商平台,于2022年9月1日在美国、加拿大、新加坡、中国台湾、中国香港等市场上线。本文作者从销售额、销量、产品分布等方面,对Temu产品进行了分析,一起来看一下吧。

py 复制代码
item_get获得商品详情

item_review获得商品评论列表

item_search按关键字搜索商品

请求地址: http://wechat:17610352720.cn

数据采集

采集的字段包括:商品名、商品id、原价、现价、一级分类、二级分类、店铺id、销量等;

上图是监控的temu数据中月销售额Top10的产品

数据用途:

  • 量化分析
  • 投资分析
  • 跨境电商选品分析
  • 练手学习

上图为temu单品销量Top10,由于销量最大显示10万+,所以该统计意义不大。

py 复制代码
def send_request(url):
    proxy = ProxyClient.random_ip()
    session = requests.Session()
    proxies = {
        "http": f"http://{proxy}",
        "https": f"http://{proxy}"
    }
    cookies = {
        'region': '211',
        'language': 'en',
        'currency': 'USD',
        'timezone': 'Asia%2FShanghai',
        'shipping_city': '211%2C211000000022022',
    }
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/112.0',
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8',
        'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
    }
    response = session.get(
        url,
        headers=headers,
        proxies=proxies,
        cookies=cookies,
        # params=params,
        timeout=10,
        allow_redirects=False
    )
    # html = response.text
    raw_data1 = re.findall(r"window\.rawData\s*=\s*(\{.+?\});", response.text, re.DOTALL)
    raw_data = json.loads(raw_data1[0])
    print(raw_data)

联系

全量数据 定制开发

感谢观看~

相关推荐
阿蒙Amon24 分钟前
【Python小工具】使用 OpenCV 获取视频时长的详细指南
python·opencv·音视频
橘子编程1 小时前
Python-Word文档、PPT、PDF以及Pillow处理图像详解
开发语言·python
陈敬雷-充电了么-CEO兼CTO1 小时前
推荐算法系统系列>推荐数据仓库集市的ETL数据处理
大数据·数据库·数据仓库·数据挖掘·数据分析·etl·推荐算法
蓝婷儿2 小时前
Python 机器学习核心入门与实战进阶 Day 2 - KNN(K-近邻算法)分类实战与调参
python·机器学习·近邻算法
之歆2 小时前
Python-封装和解构-set及操作-字典及操作-解析式生成器-内建函数迭代器-学习笔记
笔记·python·学习
麻雀无能为力2 小时前
CAU数据挖掘 支持向量机
人工智能·支持向量机·数据挖掘·中国农业大学计算机
天天爱吃肉82183 小时前
ZigBee通信技术全解析:从协议栈到底层实现,全方位解读物联网核心无线技术
python·嵌入式硬件·物联网·servlet
Allen_LVyingbo4 小时前
Python常用医疗AI库以及案例解析(2025年版、上)
开发语言·人工智能·python·学习·健康医疗
马特说4 小时前
React金融数据分析应用性能优化实战:借助AI辅助解决18万数据量栈溢出Bug
react.js·金融·数据分析
智能砖头4 小时前
LangChain 与 LlamaIndex 深度对比与选型指南
人工智能·python