技术栈
html解析
程序无涯海
4 个月前
爬虫
·
python
·
html
·
beautifulsoup
·
html解析
Python爬虫教程第5篇-使用BeautifulSoup查找html元素几种常用方法
上一篇详细的介绍了如何使用Beautiful Soup的使用方法,但是最常用的还是如何解析html元素,这里再汇总介绍下查询html元素的一些方式,比如通过id查找、通过xpath查找、通过css查找等方式的最佳实践。
程序无涯海
4 个月前
爬虫
·
python
·
beautifulsoup
·
html解析
Python爬虫教程第4篇-使用BeautifulSoup解析html
在前面两篇文章中介绍了如何使用reqeusts发起请求和获取返回内容,很多爬取的内容大多是html数据,这一篇我们讲如何去解析html。Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航。查找,修改文档的方式。Beautiful Soup会帮你节省数小时甚至数天的工作时间。