python爬虫实战——自动话获取淘宝商品数据

嗨喽,大家好呀~这里是爱看美女的茜茜呐

开发环境:

  • python 3.8

  • pycharm 专业版

三方库:
  • DrissionPage >>> pip install DrissionPage

如何安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令


👇 👇 👇 更多精彩机密、教程,尽在下方,赶紧点击了解吧~

python源码、视频教程、插件安装教程、资料我都准备好了,直接在文末名片自取就可


代码展示

导入模块

python 复制代码
from DrissionPage import ChromiumPage
from info import USERNAME, PASSWORD
import time
import re
import json
import csv
python 复制代码
page = ChromiumPage()
page.listen.start('h5/mtop.relationrecommend.wirelessrecommend.recommend/2.0/')
  1. 打开一个窗口
python 复制代码
# page.get('https://login.taobao.com/member/login.jhtml')
  1. 匹配到账号输入框 并输入账号信息
python 复制代码
# page.ele('xpath://input[@id="fm-login-id"]').input(USERNAME)
  1. 匹配到密码输入框 并输入密码信息
python 复制代码
# page.ele('xpath://input[@id="fm-login-password"]').input(PASSWORD)
  1. 点击登陆
python 复制代码
# page.ele('xpath://button[@class="fm-button fm-submit password-login"]').click()
# time.sleep(2)
# page.get('https://s.taobao.com/search?_input_charset=utf-8&commend=all&ie=utf8&initiative_id=tbindexz_20170306&q=iphone%2015%20pro%20max&search_type=item&source=suggest&sourceId=tb.index&spm=a21bo.jianhua.201856-taobao-item.2&ssid=s5-e&suggest=0_8&suggest_query=ip&wq=ip')
# packet = page.listen.wait()
# print(packet.response.body)
for i in range(10):
    page.ele('xpath://button[@class="next-btn next-small next-btn-normal next-pagination-item next-next"]').click()
    pack = page.listen.wait()
    mtopjson = re.findall('mtopjsonp\d+\((.*)\)', pack.response.body)[0]
    print(mtopjson)
    mtopdict = json.loads(mtopjson)
    itemsArray = mtopdict['data']['itemsArray']
    for item in itemsArray:
        title = item['title']
        price = item['price']
        realSales = item['realSales']
        procity = item['procity']
        shop_name = item['shopInfo']['title']
        print(title, price, realSales, procity, shop_name)
        with open('taobao.csv', mode='a', newline='', encoding='utf-8') as f:
            csv_writer = csv.writer(f)
            csv_writer.writerow([title, price, realSales, procity, shop_name])
    time.sleep(2)

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

相关推荐
初生牛犊不怕苦19 分钟前
与AI一起学习《C专家编程》:数组与指针
c语言·学习·算法
白毛大侠21 分钟前
Go Goroutine 与用户态是进程级
开发语言·后端·golang
ForteScarlet30 分钟前
从 Kotlin 编译器 API 的变化开始: 2.3.20
android·开发语言·后端·ios·开源·kotlin
elseif12331 分钟前
浅谈 C++ 学习
开发语言·c++·学习
华科大胡子33 分钟前
Chrome安全机制深度解析
python
易标AI38 分钟前
标书智能体(四)——提示词顺序优化,让缓存命中,输入成本直降10倍
人工智能·python·提示词·智能体·招投标
SuperEugene39 分钟前
Vue3 性能优化规范:日常必做优化(不玄学、可落地)|可维护性与兜底规范篇
开发语言·前端·javascript·vue.js·性能优化·前端框架
Binary-Jeff39 分钟前
Spring 创建 Bean 的关键流程
java·开发语言·前端·spring boot·后端·spring·学习方法
Frank_refuel42 分钟前
QT->信号与槽详解上(概述、使用、自定义、连接方式、其他说明)
开发语言·qt
深耕AI42 分钟前
【VS Code 中 Python 虚拟环境降级完整指南(含 uv 工具实战)】
开发语言·python·uv