【Python】【爬虫】爬取虎扑网NBA排行数据

代码

python 复制代码
NBA_URL = 'https://nba.hupu.com/stats/players/pts'
HEADERS = {'User-Agent': 'Mozilla/5.0'}
python 复制代码
from global_parameters import NBA_URL, HEADERS
import requests
from lxml import etree

response = requests.get(NBA_URL, headers=HEADERS)  # <Response [200]>
html_txt = response.text
html_element = etree.HTML(html_txt)  # <Element html at 0x253a77aa540>

ranks = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[1]/text()')
names = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[2]/a/text()')
teams = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[3]/a/text()')
goals = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[4]/text()')

with open('nba_data.txt', 'w', encoding='utf-8') as f:
    f.write('rank,name,team,goal\n')
    for rank, name, team, goal in zip(ranks, names, teams, goals):
        f.write(f'{rank},{name},{team},{goal}\n')

效果

相关推荐
花酒锄作田11 小时前
Pydantic校验配置文件
python
hboot11 小时前
AI工程师第四课 - 深度学习入门
pytorch·python·神经网络
GBASE16 小时前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
ZhengEnCi1 天前
P2M-Matplotlib折线图完全指南-从数据可视化到趋势分析的Python绘图利器
python·matlab·数据可视化
ZhengEnCi1 天前
P2L-Matplotlib饼图完全指南-从数据可视化到图表定制的Python绘图利器
python·matlab
曲幽1 天前
你的REST接口还在“过度投喂”数据吗?——FastAPI + GraphQL实战避坑指南
python·fastapi·web·graphql·route·cors·rest·strawberry
用户8358086187911 天前
基于 Self-RAG 与列表级重排序的进阶 RAG 系统设计与实现
python
xiezhr1 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
Warson_L2 天前
Python `Annotated` 与 LangGraph Reducer 学习笔记
python
韩师傅2 天前
海天线算法的前世今生
python·计算机视觉