【Python】【爬虫】爬取虎扑网NBA排行数据

代码

python 复制代码
NBA_URL = 'https://nba.hupu.com/stats/players/pts'
HEADERS = {'User-Agent': 'Mozilla/5.0'}
python 复制代码
from global_parameters import NBA_URL, HEADERS
import requests
from lxml import etree

response = requests.get(NBA_URL, headers=HEADERS)  # <Response [200]>
html_txt = response.text
html_element = etree.HTML(html_txt)  # <Element html at 0x253a77aa540>

ranks = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[1]/text()')
names = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[2]/a/text()')
teams = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[3]/a/text()')
goals = html_element.xpath('//table[@class="players_table"]//tr[position()>1]/td[4]/text()')

with open('nba_data.txt', 'w', encoding='utf-8') as f:
    f.write('rank,name,team,goal\n')
    for rank, name, team, goal in zip(ranks, names, teams, goals):
        f.write(f'{rank},{name},{team},{goal}\n')

效果

相关推荐
惊讶的猫几秒前
Redis持久化介绍
数据库·redis·缓存
阔皮大师4 分钟前
INote轻量文本编辑器
java·javascript·python·c#
小法师爱分享8 分钟前
StickyNotes,简单便签超实用
java·python
深蓝电商API8 分钟前
处理字体反爬:woff字体文件解析实战
爬虫·python
开源技术10 分钟前
Claude Opus 4.6 发布,100万上下文窗口,越贵越好用
人工智能·python
Apple_羊先森13 分钟前
ORACLE数据库巡检SQL脚本--19、磁盘读次数最高的前5条SQL语句
数据库·sql·oracle
张3蜂22 分钟前
深入理解 Python 的 frozenset:为什么要有“不可变集合”?
前端·python·spring
皮卡丘不断更35 分钟前
手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”
人工智能·spring boot·python·ai编程
全栈前端老曹1 小时前
【MongoDB】Node.js 集成 —— Mongoose ORM、Schema 设计、Model 操作
前端·javascript·数据库·mongodb·node.js·nosql·全栈
爱打代码的小林1 小时前
基于 MediaPipe 实现实时面部关键点检测
python·opencv·计算机视觉