【Python学习】爬虫:获取表格

python 复制代码
import requests
from bs4 import BeautifulSoup
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
}
place=[]
pm25=[]

def get_info(url):
    res=requests.get(url,headers=headers)
    soup=BeautifulSoup(res.text,'lxml')
    table = soup.find_all("table")
    rows = table[0].find_all("tr")

    i=0
    for row in rows:
        if(i>0):
            cols=row.find_all("td")
            place.append(cols[0].text)
            pm25.append(int(cols[1].text))

        i+=1

    for d1,d2 in zip(place,pm25):
        print(d1,d2)
        #print(d2)



url="http://www.pm25.in/nanjing"
get_info(url)
相关推荐
Drawing stars1 小时前
JAVA后端 前端 大模型应用 学习路线
java·前端·学习
崇山峻岭之间1 小时前
Matlab学习记录33
开发语言·学习·matlab
小二·1 小时前
Python Web 开发进阶实战:性能压测与调优 —— Locust + Prometheus + Grafana 构建高并发可观测系统
前端·python·prometheus
科技林总2 小时前
【系统分析师】3.5 多处理机系统
学习
七牛云行业应用2 小时前
重构实录:我删了 5 家大模型 SDK,只留了 OpenAI 标准库
python·系统架构·大模型·aigc·deepseek
知乎的哥廷根数学学派3 小时前
基于多模态特征融合和可解释性深度学习的工业压缩机异常分类与预测性维护智能诊断(Python)
网络·人工智能·pytorch·python·深度学习·机器学习·分类
一人の梅雨3 小时前
亚马逊SP-API商品详情接口轻量化实战:合规与商业价值提取指南
python
芯思路3 小时前
STM32开发学习笔记之三【按键】
笔记·stm32·学习
charlie1145141914 小时前
从 0 开始的机器学习——NumPy 线性代数部分
开发语言·人工智能·学习·线性代数·算法·机器学习·numpy
咚咚王者4 小时前
人工智能之核心基础 机器学习 第十二章 半监督学习
人工智能·学习·机器学习