lesson45
1.直接设置各种Code,和desc的函数
2.错误码失败了,也要返回给用户
3.设置响应报头 做回应时候用
4.读取文件内容,开始要清空内容out
5.访问带图片的资源:网页中有几个资源,就发起几次请求,
6.需要提取文件后缀
7.读文件要用二进制方式读 ,读取缓冲区也要扩大
缓冲区少可能导致图片显示不出来。
user agent是有相关客服信息,服务器根据user agent推送适合的软件
wget可以获取网页
爬虫:网站首页拿到,有很多链接,提取a标签 或者href,后面链接获取,重复获取网页。
模拟http客户端 简单的就是get 网页链接 协议版本,对应反扒机制,把useragent信息放入http请求里,就可以骗过服务器。
accep是浏览器能接受什么类型
accep encoding 网页有时候很大,需要压缩解压gzip浏览器可以识别
refer就是从那个页面跳转过来的
