【金融项目实战】9_接口测试 _BeautifulSoup基本使用

文章目录

一、基本介绍

  • Beautiful Soup是一个可以从HTML或XMIL文计中提取数据的Python库.
  • 它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.
  • Beautiful Soup会帮你节省数小时甚至数天的工作时间.
  • Beautiful Soup 3目前已经停止开发,推荐在项目中使用Beautiful Soup 4,简称BS4.
yacas 复制代码
一个python解析HTML\xml的三方库

二、使用步骤

2.1 安装

shell 复制代码
pip install beautifulsoup4

注意:包的名称为beautifulsoup4而不是BeautifulSoup,BeautifulSoup是Beautiful Soup3的发布版。

2.2 如何使用

python 复制代码
# 导入类
from bs4 import BeautifulSoup  

 # 实例化
soup = BeautifulSoup(open("index.html"), "html.parser")  # 方法1
soup = BeautifulSoup(内容, "html.parser") # 方法2



ele = soup.标签名  #根据标签名获取标签对象,如果匹配多个元素,则返回第一个
ele_list = soup.find_all(标签名)   # 根据标签名获取所有匹配的标签


attr_value = ele.get(属性名)  # 根据标签的属性名获取对应的属性值

text = ele.get_text()   # 获取标签的文本内容
yacas 复制代码
说明:
- 将一段文档传入BeautifulSoup的构造方法,就能得到一个文档的对象
- "html.parser": Python标准库中的HTML解析器。BeautifulSoup还支持一些第三方的解析器,如:lxml、html5lib等,这些第三方解析器需要额外安装

三、示例

应用步骤:

1、导包

2、实例化(获取文件内容)

3、调用方法

python 复制代码
# 1、导包
from bs4 import BeautifulSoup
test = """
    <html>
        <head>
            <title>程序员</title>
        </head>
        <body>
            <p id="test01">软件测试</p>
            <p id="test02">2020年</p>
            <a href="/api.html">接口测试</a>
            <a href="/web.html">web自动化测试</a>
            <a href="/app.html">APP自动化测试</a>
        </body>
    </html>
"""

#2、获取bs对象  告诉BeautifulSoup类,你要解析的是hmtl格式
bs = BeautifulSoup(test,"html.parser")

#3、调用方法
"""
重点:
    1、查找所有标签 bs.find_all("标签名") == 元素的集合 == ["元素1", "元素2"]
    2、提取属性值  标签名.get("属性名")
"""

for a in bs.find_all("a"):
    print(a.get("href"))

# 4、其它方法
print(bs.p.string)  # 获取P标签的文本

# 5、获取标签名
print(bs.p.name)
相关推荐
爆更小哇8 天前
pytest集成Allure报告教程
python·测试工具·pytest·接口测试·allure
淮北4949 天前
ubuntu22.04将mp4转换成gif
python·scrapy·flask·beautifulsoup·pyqt·matplotlib
NiKick11 天前
网页数据抓取:融合BeautifulSoup和Scrapy的高级爬虫技术
爬虫·scrapy·beautifulsoup
Elaine33615 天前
【软件测试系统学习笔记:从理论基础到接口实战】
软件测试·笔记·学习·接口测试
测试199816 天前
postman接口测试详解
自动化测试·软件测试·python·测试工具·测试用例·接口测试·postman
万粉变现经纪人19 天前
如何解决 import aiohttp ModuleNotFoundError: No module named ‘aiohttp’
python·scrapy·beautifulsoup·aigc·pillow·pip·httpx
小白学大数据23 天前
Python requests + BeautifulSoup 爬取豆瓣电影图片
开发语言·python·beautifulsoup
luom010225 天前
诊疗室技术文章大纲
python·beautifulsoup·tornado·dash