Java爬虫入门(2/5)

一、HTTP(超文本传输协议)是什么

HTTP(超文本传输协议):是一种用于网络传输超文本到本地浏览器的传输协议。定义了客户端和服务器之间请求和响应的格式。HTTP工作在TCP/IP模型之上,常用80 端口。

区别于HTTPS(超文本传输安全协议):是HTTP的安全版本,HTTP下增加了SSL/TLS协议,提供了数据加密、完整性校验和身份验证。常用443端口。

工作原理: 客户端发送请求▶️服务端处理请求▶️服务端返回响应▶️客户端渲染页面

二、网页的三种数据来源

  • 静态HTML(HTML基础内容)
  • 接口JSON(外部数据)
  • JS动态渲染(JS/CSS表现与交互)

三、HTTPClient、OKHttp的使用(发送HTTP请求)

四、Jsoup的使用(解析HTML)

五、Jackson、Fastjson的使用(解析JSON)

相关推荐
Re_zero33 分钟前
线上日志被清空?这段仅10行的 IO 代码里竟然藏着3个毒瘤
java·后端
洋洋技术笔记39 分钟前
Spring Boot条件注解详解
java·spring boot
程序员清风19 小时前
程序员兼职必看:靠谱软件外包平台挑选指南与避坑清单!
java·后端·面试
皮皮林55120 小时前
利用闲置 Mac 从零部署 OpenClaw 教程 !
java
华仔啊1 天前
挖到了 1 个 Java 小特性:var,用完就回不去了
java·后端
SimonKing1 天前
SpringBoot整合秘笈:让Mybatis用上Calcite,实现统一SQL查询
java·后端·程序员
日月云棠2 天前
各版本JDK对比:JDK 25 特性详解
java
用户8307196840822 天前
Spring Boot 项目中日期处理的最佳实践
java·spring boot
JavaGuide2 天前
Claude Opus 4.6 真的用不起了!我换成了国产 M2.5,实测真香!!
java·spring·ai·claude code
IT探险家2 天前
Java 基本数据类型:8 种原始类型 + 数组 + 6 个新手必踩的坑
java