Java基础知识(11)

Java基础知识(11)

(包括:IO流高级流,网络爬虫基础,Commons-i0工具包和Hutool工具包)

目录

Java基础知识(11)

一.IO流高级流

1.缓冲流

【1】字节缓冲流

(1)基础知识

(2)方法

[[2] 字符缓冲流(其实基本流里已经有缓冲区了,速度提升不大)](#[2] 字符缓冲流(其实基本流里已经有缓冲区了,速度提升不大))

(1)构造方法

(2)字符缓冲流特有方法

2.转换流

【1】转换流是字符流和字节流之间的桥梁

【2】作用

(1)作用1:

(2)作用2:

3.序列化流/对象操作输出流

(1)可以把Java中的对象写到本地文件中

(2)构造方法

(3)成员方法

(4)案例

(5)序列化流的小细节

[4. 反序列化流 /对象操作输入流](#4. 反序列化流 /对象操作输入流)

(1)可以把序列化到本地文件中的对象,读取到程序中来

(2)构造方法

(3)成员方法

(4)序列化流/反序列化流的细节汇总

[5. 打印流](#5. 打印流)

【1】分类:打印流一般是指:PrintStream,PrintWriter两个类

【2】字节打印流(字节流底层没有缓冲区,开不开自动刷新都一样)

(1)构造方法

(2)成员方法

【3】字符打印流(字符流底层有缓冲区,想要自动刷新需要开启)

(1)构造方法

(2)成员方法

[6. 解压缩流](#6. 解压缩流)

(1)解压本质:把每一个ZipEntry按照层级拷贝到本地另一个文件夹中

(2)例子:

[7. 压缩流](#7. 压缩流)

(1)压缩本质:把每一个(文件/文件夹)看成ZipEntry对象放到压缩包中

(2)例子:

[8. Commons-i0](#8. Commons-i0)

[9. Hutool工具包](#9. Hutool工具包)

10.网络爬虫

(1)前置知识案例

(2)网络爬虫案例

1)

2)

3)Hutool中有类似的方法,上面仅供理解!!!!


一.IO流高级流

1.缓冲流

【1】字节缓冲流
(1)基础知识

BufferedinputStream 字节缓冲输入流

BufferedOutputStream字节缓冲输出流

原理:底层自带了长度为8192的缓冲区提高性能

(2)方法

1)public BufferedInputStream(InputStream is)把基本流包装成高级流,提高读取数据的性能

2)public BufferedOutputStream(0utputStream os) 把基本流包装成高级流,提高写出数据的性能

3)案例

BufferedInputStream bis = new BufferedInputStream(new FileInputstream( name: "myio\\a.txt"));

BufferedoutputStream bos = new BufferedoutputStream(new File0utputstream( name: "myio\\copy.txt"));

[2] 字符缓冲流(其实基本流里已经有缓冲区了,速度提升不大)
(1)构造方法

public BufferedReader(Reader r) 把基本流变成高级流

public Bufferedwriter(Writer r) 把基本流变成高级流

(2)字符缓冲流特有方法

字符缓冲输入流特有方法:

public string readLine() 读取一行数据,如果没有数据可读了,会返回null

字符缓冲输出流特有方法:

public void newLine() 跨平台的换行

2.转换流

【1】转换流是字符流和字节流之间的桥梁
【2】作用
(1)作用1:

1)指定字符集读写

2)案例

//创建对象并指定字符编码

InputStreamReader isr = new InputStreamReader(new FileInputStream(mvio\lgbkfile.txt"),"GBK");

(在JDK11有更好的方法:FileReader fr=new FileReader("myio\\gbkfile,txt",charset.forName("GBK"));)

(2)作用2:

1)字节流想要使用字符流中的方法

2)案例

FileInputStream fis = new FileInputStream( name: "myio\la.txt");

InputStreamReader isr=new InputStreamReader(fis);

BufferedReader br =new BufferedReader(isr);

string str= br.readLine();

即:BufferedReader br = new BufferedReader(new InputstreamReader(new fileInputstream( name: "myio\\a.txt")));

3.序列化流/对象操作输出流

(1)可以把Java中的对象写到本地文件中
(2)构造方法

public ObjectOutputStream(0utputStream out) 把基本流包装成高级流

(3)成员方法

public final void write0bject(object obj)把对象序列化(写出)到文件中去

Student stu = new student( name:"zhangsan",age: 23);

(4)案例

ObjectOutputstream oos = new objectoutputstream(new File0utputstream( name: "myio\la.txt"));

oos.writeobject(stu);

(5)序列化流的小细节

使用对象输出流将对象保存到文件时会出现NotserializableException异常

解决方案:需要让Javabean类实现Serializable接口(标记性接口)

4. 反序列化流 /对象操作输入流

(1)可以把序列化到本地文件中的对象,读取到程序中来
(2)构造方法

public objectInputstream(Inputstream out) 把基本流变成高级流

(3)成员方法

public object readobject()把序列化到本地文件中的对象,读取到程序中来(需要进行强转)

(4)序列化流/反序列化流的细节汇总

① 使用序列化流将对象写到文件时,需要让Javabean类实现Serializable接口,否则,会出现NotSerializableException异常

② 序列化流写到文件中的数据是不能修改的,一旦修改就无法再次读回来了

③ 序列化对象后,修改了Javabean类,再次反序列化,会不会有问题?

会出问题,会抛出InvalidclassException异常

解决方案:给lavabean类添加serialVersionUID(列号、版本号)

private static final long serialVersionUID = -6357601841666449654L;

可用idea自动生成。

④如果一个对象中的某个成员变量的值不想被序列化,又该如何实现呢?

解决方案:给该成员变量加transient关键字修饰,该关键字标记的成员变量不参与序列化过程

⑤如果需要将多个对象进行序列化,一般规定将其放入一个集合中,序列化集合

5. 打印流

【1】分类:打印流一般是指:PrintStream,PrintWriter两个类

特点1:打印流只操作文件目的地,不操作数据源

特点2:特有的写出方法可以实现,数据原样写出

例如:打印:97 文件中:97

特点3:特有的写出方法,可以实现自动刷新,自动换行

打印一次数据=写出+换行+刷新

【2】字节打印流(字节流底层没有缓冲区,开不开自动刷新都一样)
(1)构造方法

public Printstream(0utputStream/File/string) 关联字节输出流/文件/文件路径(重要)

public PrintStream(String fileName,Charset charset) 指定字符编码(重要)

public PrintStream(OutputStream out,boolean autoFlush) 自动刷新

public PrintStream(0utputStream out,boolean autoFlush, String encoding) 指定字符编码且自动刷新

(2)成员方法

public void write(int b) 常规方法:规则跟之前一样,将指定的字节写出

public void println(Xxx xx) 特有方法:打印任意数据,自动刷新,自动换行

public void print(Xxx xx) 特有方法:打印任意数据,不换行

public void printf(String format,Object... args)特有方法:带有占位符的打印语句,不换行

【3】字符打印流(字符流底层有缓冲区,想要自动刷新需要开启)
(1)构造方法

public PrintWriter(Write/File/String) 关联字节输出流/文件/文件路径

public PrintWriter(String fileName, charset charset) 指定字符编码

public PrintWriter(Write w,boolean autoFlush) 自动刷新

public PrintWriter(0utputStream out, boolean autoFlush, charset charset) 指定字符编码且自动刷新

(2)成员方法

public void write(int b) 常规方法:规则跟之前一样,写出字节或者字符串

public void println(Xxx xx) 特有方法:打印任意数据,自动刷新,自动换行

public void print(Xxx xx) 特有方法:打印任意数据,不换行

public void printf(String format,Object... args)特有方法:带有占位符的打印语句,不换行

6. 解压缩流

(1)解压本质:把每一个ZipEntry按照层级拷贝到本地另一个文件夹中
(2)例子:

//创建一个解压缩流用来读取压缩包中的数据

ZipInputstream zip = new ZipInputstream(new FileInputstream(src));

//要先获取到压缩包里面的每一个zipentry对象

//表示当前在压缩包中获取到的文件或者文件夹

ZipEntry entry;

while((entry= zip.getNextEntry())!= nu11){

System.out.println(entry);

}

7. 压缩流

(1)压缩本质:把每一个(文件/文件夹)看成ZipEntry对象放到压缩包中
(2)例子:

public static void tozip(File src,File dest)throws IoException {

//1.创建压缩流关联压缩包

Zipoutputstream zos = new zipoutputstream(new File0utputstream(new File(dest, child: "a.zip")));

//2.创建zipEntry对象,表示压缩包里面的每一个文件和文件夹

ZipEntry entry = new zipEntry( name:"a.txt");

//3.把ZipEntry对象放到压缩包当中

zos.putNextEntry(entry);

//4.把src文件中的数据写到压缩包当中

FileInputstream fis = new FileInputstream(src);

int b;

while((b=fis.read())!=-1){

zos.write(b);

zos.closeEntry();

zos.close();

}

8. Commons-i0

(1)简介

Commons-io是apache开源基金组织提供的一组有关I0操作的开源工具包。

作用:提高I0流的开发效率,

(2)Commons-io使用步骤

1)在项目中创建一个文件夹:lib

2)将jar包复制粘贴到lib文件夹

3)右键点击jar包,选择 Add as Library ->点击OK

4)在类中导包使用

5)文档在仅我可见中。

9. Hutool工具包

官网:

https://hutool.cn/

API文档:

https://apidoc.gitee.com/dromara/hutool/

中文使用文档:

https://hutool.cn/docs/#/

10.网络爬虫

(1)前置知识案例

//Pattern:表示正则表达式

//Matcher:文本匹配器,作用按照正则表达式的规则去读取字符串,从头开始读取,在大串中去找符合匹配规则的子串。

//获取正则表达式的对象

Pattern p=Pattern.compile("Java\\d{0,2}");

//获取文本匹配器的对象

//m:文本匹配器的对象

//str:大串

//p:规则

//m:要在str中找符合p规则的小串

Matcher m=p.matcher(str);

//拿着文本匹配器从头开始读取,寻找是否有满足规则的子串

//如果没有,方法返回false

//如果有,返回true。在底层记录子串的起始索引和结束索引+1

//如:0,4

boolean b=m.find();

//方法底层会根据find方法记录的索引进行字符串的截取

//substring(起始索引,结束索引);包头不包尾

//(0,4)但是不包含4索引

//会把截取的小串进行返回。

string s1 = m.group();

System.out.println(s1);

//第二次在调用find的时候,会继续读取后面的内容

//读取到第二个满足要求的子串,方法会继续返回true

//并把第二个子串的起始索引和结束索引+1,进行记录

b = m.find();

//第二次调用group方法的时候,会根据find方法记录的索引再次截取子串

string s2 = m.group();

System.out.println(s2);

}

(2)网络爬虫案例
1)

public static string webcrawler(string net)throws Ioxception {

//1.定义stringBuilder拼接爬取到的数据

StringBuilder sb=new stringBuilder();

//2.创建一个URL对象

URL url = new URL(net);

//3.链接上这个网址

//细节:保证网络是畅通的,而且这个网址是可以链接上的。

URLConnection conn =url.openconnection();

//4.读取数据

InputstreamReader isr = new InputStreamReader(conn.getInputstream());

int ch;

while((ch=isr.read())!=-1){

sb.append((char)ch);

//5.释放资源

isr.close();

//6.把读取到的数据返回

return sb.tostring();

}

2)

//通过正则表达式,把其中符合要求的数据获取出来

private static Arraylist<string> getData(string str, string regex){

//1.创建集合存放数据

ArrayList<string>list = new ArrayList<>();

//2.按照正则表达式的规则,去获取数据

Pattern pattern = Pattern.compile(regex);

//3.按照pattern的规则,到str当中获取数据

Matcher matcher =pattern.matcher(str);

while(matcher.find()){

list.add(matcher.group(index));

}

return list;

}

3)Hutool中有类似的方法,上面仅供理解!!!!
相关推荐
苏-言2 分钟前
Spring IOC实战指南:从零到一的构建过程
java·数据库·spring
界面开发小八哥9 分钟前
更高效的Java 23开发,IntelliJ IDEA助力全面升级
java·开发语言·ide·intellij-idea·开发工具
草莓base23 分钟前
【手写一个spring】spring源码的简单实现--容器启动
java·后端·spring
Allen Bright36 分钟前
maven概述
java·maven
编程重生之路38 分钟前
Springboot启动异常 错误: 找不到或无法加载主类 xxx.Application异常
java·spring boot·后端
薯条不要番茄酱38 分钟前
数据结构-8.Java. 七大排序算法(中篇)
java·开发语言·数据结构·后端·算法·排序算法·intellij-idea
努力进修1 小时前
“探索Java List的无限可能:从基础到高级应用“
java·开发语言·list
politeboy1 小时前
k8s启动springboot容器的时候,显示找不到application.yml文件
java·spring boot·kubernetes
Daniel 大东2 小时前
BugJson因为json格式问题OOM怎么办
java·安全
Theodore_10226 小时前
4 设计模式原则之接口隔离原则
java·开发语言·设计模式·java-ee·接口隔离原则·javaee