JAVA读取word内表格的图片,将几行几列写入图片名(非POI)

java 复制代码
package org.springblade;


import com.spire.doc.Document;
import com.spire.doc.Section;
import com.spire.doc.TableCell;
import com.spire.doc.TableRow;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.DocPicture;
import com.spire.doc.interfaces.ITable;

import javax.imageio.ImageIO;
import java.awt.image.RenderedImage;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;

public class GetTable {
	public static void main(String[] args)throws IOException {
		//加载Word测试文档
		Document doc = new Document();
		doc.loadFromFile("E:\\测试导入\\导入模板.docx");

		//获取第一节
		Section section = doc.getSections().get(0);

		//获取第一个表格
		ITable table = section.getTables().get(0);

		//创建txt文件(用于写入表格中提取的文本)
		String output = "ReadTextFromTable.txt";
		File textfile = new File(output);
		if (textfile.exists())
		{
			textfile.delete();
		}
		textfile.createNewFile();
		FileWriter fw = new FileWriter(textfile, true);
		BufferedWriter bw = new BufferedWriter(fw);

		//创建List
		List images = new ArrayList();
		HashMap<String, Object> photoMap = new HashMap<>();

		//遍历表格中的行
		for (int i = 0; i < table.getRows().getCount(); i++)
		{
			TableRow row = table.getRows().get(i);
			//遍历每行中的单元格
			for (int j = 0; j < row.getCells().getCount(); j++)
			{
				TableCell cell = row.getCells().get(j);
				//遍历单元格中的段落
				for (int k = 0; k < cell.getParagraphs().getCount(); k++)
				{
					Paragraph paragraph = cell.getParagraphs().get(k);
					bw.write(paragraph.getText() + "\t");//获取文本内容

					//遍历段落中的所有子对象
					for (int x = 0; x < paragraph.getChildObjects().getCount(); x++)
					{
						Object object = paragraph.getChildObjects().get(x);
						//判定对象是否为图片
						if (object instanceof DocPicture)
						{
							//获取图片
							DocPicture picture = (DocPicture) object;
							images.add(picture.getImage());
							//得到当前表格的行和列
							String photoName = String.format("第%s行第%s列的图片.png", i + 1, j);
							photoMap.put(photoName,picture.getImage());

						}
					}
				}
			}
			bw.write("\r\n");//写入内容到txt文件
		}
		bw.flush();
		bw.close();
		fw.close();

		//将图片以PNG文件格式保存
//		for (int z = 0; z < images.size(); z++)
//		{
//			File imagefile = new File(String.format("提取的表格图片-%d.png", z));
//			ImageIO.write((RenderedImage) images.get(z), "PNG", imagefile);
//		}

		for (String s : photoMap.keySet()) {
			File imageFile = new File(s);
			ImageIO.write((RenderedImage) photoMap.get(s), "PNG", imageFile);

		}

	}
}

在此之前必须引入maven

XML 复制代码
      <dependency>
            <groupId>e-iceblue</groupId>
            <artifactId>spire.doc.free</artifactId>
            <version>5.2.0</version>
        </dependency>
    <repositories>
        <repository>
            <id>com.e-iceblue</id>
            <name>e-iceblue</name>
            <url>https://repo.e-iceblue.com/nexus/content/groups/public/</url>
        </repository>
相关推荐
孟陬1 小时前
国外技术周刊 #1:Paul Graham 重新分享最受欢迎的文章《创作者的品味》、本周被划线最多 YouTube《如何在 19 分钟内学会 AI》、为何我不
java·前端·后端
想用offer打牌1 小时前
一站式了解四种限流算法
java·后端·go
华仔啊2 小时前
Java 开发千万别给布尔变量加 is 前缀!很容易背锅
java
也些宝2 小时前
Java单例模式:饿汉、懒汉、DCL三种实现及最佳实践
java
Nyarlathotep01133 小时前
SpringBoot Starter的用法以及原理
java·spring boot
wuwen53 小时前
WebFlux + Lettuce Reactive 中 SkyWalking 链路上下文丢失的修复实践
java
SimonKing3 小时前
GitHub 10万星的OpenCode,正在悄悄改变我们的工作流
java·后端·程序员
Seven974 小时前
虚拟线程深度解析:轻量并发编程的未来趋势
java
雨中飘荡的记忆14 小时前
ElasticJob分布式调度从入门到实战
java·后端