Java网络爬虫入门

文章目录

1、导入依赖

xml 复制代码
<dependencies>
    <!-- HttpClient -->
    <dependency>
        <groupId>org.apache.httpcomponents</groupId>
        <artifactId>httpclient</artifactId>
        <version>4.5.3</version>
    </dependency>

    <!-- 日志 -->
    <dependency>
        <groupId>org.slf4j</groupId>
        <artifactId>slf4j-log4j12</artifactId>
        <version>1.7.25</version>
    </dependency>
</dependencies>

2、CrawlerFirst

java 复制代码
package com.atguigu.crawler.test;
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import java.io.IOException;
public class CrawlerFirst {
    public static void main(String[] args) throws IOException {
        //1、打开浏览器,创建HttpClient对象
        CloseableHttpClient httpClient = HttpClients.createDefault();
        //2、输入网址,发起get请求,获取响应
        HttpGet httpGet = new HttpGet("https://blog.csdn.net/m0_65152767?spm=1010.2135.3001.5343");
        //3、使用 HttpClient 发起请求,获取响应
        CloseableHttpResponse response = httpClient.execute(httpGet);
        //4、解析响应,获取数据
        if (response.getStatusLine().getStatusCode() == 200) {
            HttpEntity httpEntity = response.getEntity();
            String content = EntityUtils.toString(httpEntity, "UTF-8");
            System.out.println(content);
        }
    }
}
相关推荐
心平气和量大福大1 分钟前
android-实例-对话框圆角
java
少许极端2 分钟前
算法奇妙屋(五十二)-备战+复习2
java·算法
Al leng2 分钟前
注释旧依赖仍残留旧Jar四大原因+分步解决(IDEA+Maven)
java·maven·intellij-idea·jar
luj_17682 分钟前
硝酸核关联假说缺乏实验证据
c语言·开发语言·c++·经验分享·算法
zkkkkkkkkkkkkk3 分钟前
python爬虫模拟拖动滑块缺口验证码
爬虫·python·ddddocr
AI分享猿3 分钟前
用MonkeyCode做数据爬虫,效率提升10倍
爬虫
想你依然心痛6 分钟前
Isaac Sim vs MuJoCo vs PyBullet:机器人仿真器选型终极指南(2026版)
java·开发语言·机器人
一个儒雅随和的男子6 分钟前
MQTT如何保证消息的可靠性
java·开发语言
snow@li10 分钟前
Java:Java后端开发,本地开发环境,服务器部署环境,运维支撑环境 都需要哪些类别的工具或技术 / Java后端三大环境完整清单 202606
java·运维·服务器
郑州光合科技余经理10 分钟前
海外版外卖系统源码:支付/地图/多语言核心代码实现
android·java·前端·后端·架构·uni-app·php