vs+qt5.0 使用poppler-qt5 操作库获取pdf所有文本输出到txt操作

先获取poppler库,编译出lib与dll,配置好依赖环境,获取某页所有文本:

QList<QString> PDFkitEngine::GetText(int nPageNum)

{

QList<QString> lstText;

Poppler::Page* pPage = NULL;

pPage = GetPage(nPageNum);

if (pPage == nullptr)

{

return lstText;

}

QList<Poppler::TextBox* > lstTexts = pPage->textList();

if (lstTexts.count() == 0)

{

return lstText;

}

for (int i = 0;i < lstTexts.count();i++)

{

lstText.append(lstTexts.at(i)->text());

}

return lstText;

}

输出到txt文本:

void PDFkitEngine::outputText(const QString& strfileName, QList<QString>& vecText)

{

QFile file(strfileName);

if (!file.open(QIODevice::WriteOnly | QIODevice::Text | QIODevice::Append))

{

return;

}

QTextStream textStream(&file);

for (auto& _info : vecText)

{

textStream << _info << endl;

}

file.close();

}

测试效果是可以将pdf文本全部读出来,并且成功的输出到文本文件,但是有点瑕疵是,pdf读出来的一行数据内容可能会分成2行或者多行,但是文本获取没有问题

相关推荐
林政硕(Cohen0415)16 分钟前
ARM Linux Qt Widget 虚拟键盘输入法移植
linux·arm开发·qt·键盘·输入法
养一回月亮!6 小时前
使用Qt实现简单绘图板:鼠标绘制与擦除功能详解
开发语言·qt
cpp_learners9 小时前
Qt Windows版本的《智能鼠标点击器》
windows·qt·鼠标点击器
Liu-Eleven12 小时前
Qt/C++开发嵌入式项目日志库选型
开发语言·c++·qt
FL162386312913 小时前
VTK源码编译时候选qt5路径
开发语言·qt
机器学习算法与Python实战16 小时前
PDF 文件翻译,我有4个方案推荐
pdf
龚建波17 小时前
《QDebug 2025年12月》
qt
特立独行的猫a20 小时前
HarmonyOS鸿蒙PC开源QT软件移植:基于 Qt Widgets 的网络调试助手工具
qt·开源·harmonyos·鸿蒙pc
世转神风-20 小时前
qt-通信协议基础-uint64_t转QByteArray-小端系统
开发语言·qt
世转神风-21 小时前
qt-uint64_t转QByteArray小端字节序并指定长度-小端系统
qt