场景需求:如何获取网页内嵌pdf文件
假设你是一位研究人员,正在寻找特定领域的最新研究报告。你访问了一个专业的学术网站,该网站提供了丰富的研究资料和文章。在浏览过程中,你发现了一个非常感兴趣的研究报告,它被嵌入在一个网页中,以PDF格式展示。然而,这个网站并没有提供直接下载该PDF文件的选项,可能是因为版权保护或其他原因。
你需要这份报告来进行进一步的研究或引用,但无法直接从网页上下载。在这种情况下,你可能会寻求一种方法来合法地获取这份PDF文件,以便在你的研究中使用。
举个例子 :
https://ngdc.cncb.ac.cn/education/courses/gwas/gwas1/
这个网页中有个课件(见下图),我一直想下载下来放到ipad的goodnotes上看,或者是上课时放到QQ群或者是微信群中分享给学生自学之类,
类似场景很多:
寻找各种中文、外文的课件资料,可能是内嵌在某些数据库、某些实验室lab、或者是某些个人博客、个人网站里。
你可能对上面这种网页很熟悉,pdf文件是内嵌其中,但是不提供pdf下载按钮以及设置,你只能在网页端1页1页的按"+"来翻页,如何保存?
是直接联系作者或网站管理员,请求他们提供PDF文件的下载链接或通过电子邮件发送给你?
还是
使用屏幕截图:如果PDF文件内容不多,你也可以考虑使用屏幕截图工具来逐页保存内容。
以google浏览器为例,edge同理
打开浏览器设置:更多工具---开发者工具,
打开开发者工具栏,
首先是选network (如果是中文浏览器,就选网络 )
再选 Fetch/XHR
也就是下面红圈标注的2个:
可以看到已经有pdf文件出现了,如果没有出现就多Ctrl+R(刷新) 几次直到出现:
接下来就是右键打开open in new tab
这个时候在网页端就能够打开pdf文件了,然后就能够使用浏览器自带的pdf管理工具下载打印pdf文件了!