【Python】【爬虫】爬取虎扑网NBA排行数据

代码

python 复制代码
NBA_URL = 'https://nba.hupu.com/stats/players/pts'
HEADERS = {'User-Agent': 'Mozilla/5.0'}
python 复制代码
from global_parameters import NBA_URL, HEADERS
import requests
from lxml import etree

response = requests.get(NBA_URL, headers=HEADERS)  # <Response [200]>
html_txt = response.text
html_element = etree.HTML(html_txt)  # <Element html at 0x253a77aa540>

ranks = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[1]/text()')
names = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[2]/a/text()')
teams = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[3]/a/text()')
goals = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[4]/text()')

with open('nba_data.txt', 'w', encoding='utf-8') as f:
    f.write('rank,name,team,goal\n')
    for rank, name, team, goal in zip(ranks, names, teams, goals):
        f.write(f'{rank},{name},{team},{goal}\n')

效果

相关推荐
睡不醒男孩0308233 小时前
第二篇:深入探索开源数据库高可用:构建基于CLup的PostgreSQL生产级高可用与读写分离架构
数据库·postgresql·开源·clup
love530love5 小时前
LiveTalking 数字人项目 Windows 部署完全指南(EPGF 架构)
人工智能·windows·python·架构·livetalking·epgf
遇事不決洛必達5 小时前
【Python基础】GIL 锁是什么及其对爬虫的影响
爬虫·python·线程·进程·gil锁
Micro麦可乐5 小时前
Spring Boot 实战:从零设计一个短链系统(含完整代码与数据库设计)
数据库·spring boot·后端·哈希算法·雪花算法·短链系统
码农阿豪5 小时前
从零到一:Spring Boot快速接入金仓数据库实战
数据库·spring boot·后端
鼎讯信通6 小时前
风电光缆运维提质增效:G-4000A 光缆故障追踪仪破解风场巡检难题
运维·网络·数据库
綝~6 小时前
爬虫数据采集工程师岗位面试题
爬虫·面试·请求
CryptoPP6 小时前
快速对接东京证券交易所API数据:实战指南与代码示例
开发语言·人工智能·windows·python·信息可视化·区块链
三十..6 小时前
MySQL 从入门到高可用架构实战精要
运维·数据库·mysql
探物 AI7 小时前
把 MambaOut 塞进 YOLOv11:会有什么样的反应
python·yolo·计算机视觉