【Python学习】爬虫:获取表格

python 复制代码
import requests
from bs4 import BeautifulSoup
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
}
place=[]
pm25=[]

def get_info(url):
    res=requests.get(url,headers=headers)
    soup=BeautifulSoup(res.text,'lxml')
    table = soup.find_all("table")
    rows = table[0].find_all("tr")

    i=0
    for row in rows:
        if(i>0):
            cols=row.find_all("td")
            place.append(cols[0].text)
            pm25.append(int(cols[1].text))

        i+=1

    for d1,d2 in zip(place,pm25):
        print(d1,d2)
        #print(d2)



url="http://www.pm25.in/nanjing"
get_info(url)
相关推荐
Flittly11 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(3)TodoWrite (待办写入)
python·agent
千寻girling15 小时前
一份不可多得的 《 Django 》 零基础入门教程
后端·python·面试
databook19 小时前
探索视觉的边界:用 Manim 重现有趣的知觉错觉
python·动效
明月_清风20 小时前
Python 性能微观世界:列表推导式 vs for 循环
后端·python
明月_清风20 小时前
Python 性能翻身仗:从 O(n) 到 O(1) 的工程实践
后端·python
helloweilei1 天前
python 抽象基类
python
用户8356290780512 天前
Python 实现 PPT 转 HTML
后端·python
zone77392 天前
004:RAG 入门-LangChain读取PDF
后端·python·面试
zone77392 天前
005:RAG 入门-LangChain读取表格数据
后端·python·agent
树獭非懒2 天前
AI大模型小白手册|Embedding 与向量数据库
后端·python·llm