用selenium和xpath定位元素并获取属性值以及str字符型转json型

页面html如图所示:

要使用xpath定位这个div元素,并且获取其属性data-config的内容值。

复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options

host='127.0.0.1'
port='10808'
chrome_options = Options()#如果是from selenium.webdriver.edge.options import Options,打开edge;如果是from selenium.webdriver.chrome.options import Options,打开chrome
chrome_options.add_argument("--proxy-server=socks5://" + host + ":" + port)

driver = webdriver.Chrome(options=chrome_options)
url = "https://xxxx.xxx/archives/1234/"
driver.get(url)
div =driver.find_element(By.XPATH,"//div[@class='dplayer dplayer-no-danmaku']")
str_attr=div.get_attribute('data-config')
print(str_attr)

import json
json_attr=json.loads(str_attr)
print(json_attr)
print(json_attr['video']['url'])

结果如图:

蓝色的为str类型,红色的为json类型。

那么先得到的是str类型,如何转换为json类型呢?使用如下代码即可。

import json

json_attr=json.loads(str_attr)

读取json数据用json_attr['video']['url']即可。具体可参阅这篇好文:

如何将 Python 字符串转换为 JSON

相关推荐
llilian_1615 小时前
选择北斗导航卫星信号模拟器注意事项总结 北斗导航卫星模拟器 北斗导航信号模拟器
功能测试·单片机·嵌入式硬件·测试工具·51单片机·硬件工程
小白学大数据17 小时前
Selenium+Python 爬虫:动态加载头条问答爬取
爬虫·python·selenium
周杰伦的稻香18 小时前
tcpdump
网络·测试工具·tcpdump
金玉满堂@bj19 小时前
什么是静态测试?
测试工具
杜子不疼.1 天前
Python + Selenium + AI 智能爬虫:自动识别反爬与数据提取
人工智能·python·selenium
williamdsy2 天前
专业的办公家具解决方案
测试工具
williamdsy2 天前
专业的办公家具哪家技术强
测试工具
williamdsy2 天前
好用的办公家具源头厂家
测试工具
UTP协同自动化测试2 天前
智能家居中控屏测试:触摸屏操作 + I2C 读取传感器 + UART 与子设备通信 + GPIO 控制
功能测试·单片机·嵌入式硬件·测试工具·智能家居
大汉堡玩测试3 天前
抓包工具Whistle的安装与使用
测试工具