技术栈

htmlagilitypack

gc_2299
6 个月前
itext7·htmlagilitypack·puppeteersharp
使用HtmlAgilityPack+PuppeteerSharp+iText7抓取IdentityServer4帮助文档需要学习IdentityServer4的用法,但是在IdentityServer4帮助文档网站(参考文献1)中没有找到下载离线文档的地方,准备使用HtmlAgilityPack+PuppeteerSharp+iText7将网站内容抓取生成离线PDF文档,便于本机学习、查看。   首先是分析网页结构,下图是帮助文档首页的html中左侧导航菜单的结构,从中可以看到以下几点:   1)整个导航菜单内容放在类名为wy-menu wy-menu-vertical的div元素内;   2)导航中一级菜单名称放在类名为