Java爬虫入门(2/5)

一、HTTP(超文本传输协议)是什么

HTTP(超文本传输协议):是一种用于网络传输超文本到本地浏览器的传输协议。定义了客户端和服务器之间请求和响应的格式。HTTP工作在TCP/IP模型之上,常用80 端口。

区别于HTTPS(超文本传输安全协议):是HTTP的安全版本,HTTP下增加了SSL/TLS协议,提供了数据加密、完整性校验和身份验证。常用443端口。

工作原理: 客户端发送请求▶️服务端处理请求▶️服务端返回响应▶️客户端渲染页面

二、网页的三种数据来源

  • 静态HTML(HTML基础内容)
  • 接口JSON(外部数据)
  • JS动态渲染(JS/CSS表现与交互)

三、HTTPClient、OKHttp的使用(发送HTTP请求)

四、Jsoup的使用(解析HTML)

五、Jackson、Fastjson的使用(解析JSON)

相关推荐
小马爱打代码几秒前
MyBatis:缓存体系设计与避坑大全
java·缓存·mybatis
时艰.6 分钟前
Java 并发编程:Callable、Future 与 CompletableFuture
java·网络
码云数智-园园7 分钟前
深入理解与正确实现 .NET 中的 BackgroundService
java·开发语言
好好研究10 分钟前
SpringBoot整合SpringMVC
xml·java·spring boot·后端·mvc
千寻技术帮11 分钟前
10386_基于SpringBoot的外卖点餐管理系统
java·spring boot·vue·外卖点餐
曹轲恒14 分钟前
SpringBoot整合SpringMVC(末)
java·spring boot·后端
_周游14 分钟前
Java8 API 文档搜索引擎_2.索引模块(程序)
java·搜索引擎·intellij-idea
小马爱打代码16 分钟前
Spring Boot:邮件发送生产可落地方案
java·spring boot·后端
BD_Marathon21 分钟前
设计模式——接口隔离原则
java·设计模式·接口隔离原则
我材不敲代码21 分钟前
Python爬虫介绍——简单了解一下爬虫
开发语言·爬虫·python