使用HtmlAgilityPack+PuppeteerSharp+iText7抓取IdentityServer4帮助文档需要学习IdentityServer4的用法,但是在IdentityServer4帮助文档网站(参考文献1)中没有找到下载离线文档的地方,准备使用HtmlAgilityPack+PuppeteerSharp+iText7将网站内容抓取生成离线PDF文档,便于本机学习、查看。 首先是分析网页结构,下图是帮助文档首页的html中左侧导航菜单的结构,从中可以看到以下几点: 1)整个导航菜单内容放在类名为wy-menu wy-menu-vertical的div元素内; 2)导航中一级菜单名称放在类名为