vs+qt5.0 使用poppler-qt5 操作库获取pdf所有文本输出到txt操作

先获取poppler库,编译出lib与dll,配置好依赖环境,获取某页所有文本:

QList<QString> PDFkitEngine::GetText(int nPageNum)

{

QList<QString> lstText;

Poppler::Page* pPage = NULL;

pPage = GetPage(nPageNum);

if (pPage == nullptr)

{

return lstText;

}

QList<Poppler::TextBox* > lstTexts = pPage->textList();

if (lstTexts.count() == 0)

{

return lstText;

}

for (int i = 0;i < lstTexts.count();i++)

{

lstText.append(lstTexts.at(i)->text());

}

return lstText;

}

输出到txt文本:

void PDFkitEngine::outputText(const QString& strfileName, QList<QString>& vecText)

{

QFile file(strfileName);

if (!file.open(QIODevice::WriteOnly | QIODevice::Text | QIODevice::Append))

{

return;

}

QTextStream textStream(&file);

for (auto& _info : vecText)

{

textStream << _info << endl;

}

file.close();

}

测试效果是可以将pdf文本全部读出来,并且成功的输出到文本文件,但是有点瑕疵是,pdf读出来的一行数据内容可能会分成2行或者多行,但是文本获取没有问题

相关推荐
羽翼未丰的啊博11 小时前
DBC_2_C上位机
qt·车载系统·汽车
大米粥哥哥11 小时前
Qt 报错qt.qpa.plugin: Could not find the Qt platform plugin “xcb“ in ““【已解决】
开发语言·qt·plugin·linuxdeployqt·xcb
偶尔贪玩的骑士12 小时前
Jupyter Notebook导出带中文字体PDF
ide·jupyter·pdf
云中飞鸿13 小时前
qt中显示日志的一般是哪个控件?
开发语言·qt
森G13 小时前
34、事件的分发机制---------事件系统
c++·qt
软件工程小施同学16 小时前
国家数据基础设施标准、技术文件汇总(附pdf下载)
pdf
Frank_refuel16 小时前
QT->信号与槽详解下(概述、使用、自定义、连接方式、其他说明)
开发语言·qt
manyikaimen17 小时前
博派智能-运动控制技术-RTCP-五轴联动
c++·图像处理·qt·算法·计算机视觉·机器人·c#
雪的季节17 小时前
deleteLater跨线程安全触发时机解析
开发语言·qt·安全
开开心心就好17 小时前
一键隐藏桌面图标任务栏的实用工具
人工智能·pdf·音视频·语音识别·媒体·测试覆盖率·威胁分析