

该书以项目为导向,以任务为驱动,较为全面地介绍了不同场景下Python爬取网络数据的方法,包括静态网页、动态网页、登录后才能访问的网页、PC客户端、App等场景。全书设计思路以应用为中心,每一章都围绕一个项目展开,让读者明确如何利用所学知识来解决问题,通过实训和课后练习巩固所学知识,使读者真正理解并能够应用所学知识。
-
项目1 了解爬虫与 Python 爬虫环境
-
项目2 爬虫基础知识准备
-
项目3 简单静态网页爬取---获取某企业官网基本信息
-
项目4 爬取动态网页------获取图书基本信息
-
项目5 模拟登录---登录某企业官网
-
项目6 终端协议分析------获取某音乐PC客户端和APP数据
-
项目7 使用 Scrapy 爬虫------爬取某企业官网新闻动态
-
国规教材
该书全面贯彻二十大报告精神,坚持为党育人、为国育才为己任,以社会主义核心价值观为指引,尊重人才培养时代性、规律性、创造性。全书站在初学者的角度,以项目为导向,将Python爬虫常用技术和真实项目相结合,循序渐进地讲解学习网络爬虫必备的基础知识,以及一些爬虫库、框架的基本用法。全书设计思路以应用为中心,每一章都围绕一个项目展开,让读者明确如何利用所学知识来解决问题,通过实训和课后练习巩固所学知识,使读者真正理解并能够应用所学知识。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于思路的启发与解决方案的实施。通过从任务需求到实现这一完整工作流程的体验,读者将对Python网络爬虫技术真正理解与掌握。
