Java爬虫入门(2/5)

一、HTTP(超文本传输协议)是什么

HTTP(超文本传输协议):是一种用于网络传输超文本到本地浏览器的传输协议。定义了客户端和服务器之间请求和响应的格式。HTTP工作在TCP/IP模型之上,常用80 端口。

区别于HTTPS(超文本传输安全协议):是HTTP的安全版本,HTTP下增加了SSL/TLS协议,提供了数据加密、完整性校验和身份验证。常用443端口。

工作原理: 客户端发送请求▶️服务端处理请求▶️服务端返回响应▶️客户端渲染页面

二、网页的三种数据来源

  • 静态HTML(HTML基础内容)
  • 接口JSON(外部数据)
  • JS动态渲染(JS/CSS表现与交互)

三、HTTPClient、OKHttp的使用(发送HTTP请求)

四、Jsoup的使用(解析HTML)

五、Jackson、Fastjson的使用(解析JSON)

相关推荐
伯恩bourne1 分钟前
Google Guava:Java 核心工具库的卓越之选
java·开发语言·guava
小王不爱笑13214 分钟前
Spring 基础核心
java
心勤则明24 分钟前
用 Spring AI Alibaba 打造智能查询增强引擎
java·人工智能·spring
Arva .25 分钟前
Spring 的三级缓存,两级够吗
java·spring·缓存
爱喝一杯白开水1 小时前
Java 定时任务完全指南
java
毕设源码-郭学长1 小时前
【开题答辩全过程】以 高校自动排课系统的设计与实现为例,包含答辩的问题和答案
java
indexsunny1 小时前
互联网大厂Java面试实战:从Spring Boot到微服务架构的深度解析
java·spring boot·spring cloud·kafka·prometheus·security·microservices
ChoSeitaku2 小时前
NO.2|proto3语法|消息类型|通讯录|文件读取|enum类型
java·服务器·前端
庞轩px2 小时前
MinorGC的完整流程与复制算法深度解析
java·jvm·算法·性能优化
zhouping@2 小时前
JAVA学习笔记day06
java·笔记·学习