vs+qt5.0 使用poppler-qt5 操作库获取pdf所有文本输出到txt操作

先获取poppler库,编译出lib与dll,配置好依赖环境,获取某页所有文本:

QList<QString> PDFkitEngine::GetText(int nPageNum)

{

QList<QString> lstText;

Poppler::Page* pPage = NULL;

pPage = GetPage(nPageNum);

if (pPage == nullptr)

{

return lstText;

}

QList<Poppler::TextBox* > lstTexts = pPage->textList();

if (lstTexts.count() == 0)

{

return lstText;

}

for (int i = 0;i < lstTexts.count();i++)

{

lstText.append(lstTexts.at(i)->text());

}

return lstText;

}

输出到txt文本:

void PDFkitEngine::outputText(const QString& strfileName, QList<QString>& vecText)

{

QFile file(strfileName);

if (!file.open(QIODevice::WriteOnly | QIODevice::Text | QIODevice::Append))

{

return;

}

QTextStream textStream(&file);

for (auto& _info : vecText)

{

textStream << _info << endl;

}

file.close();

}

测试效果是可以将pdf文本全部读出来,并且成功的输出到文本文件,但是有点瑕疵是,pdf读出来的一行数据内容可能会分成2行或者多行,但是文本获取没有问题

相关推荐
友友马20 小时前
『QT』窗口 (一)
开发语言·数据库·qt
2739920291 天前
AES加解密(QT)
qt
颜*鸣&空2 天前
QT实现串口通信+VSPD+串口调试工具
开发语言·qt
颜*鸣&空2 天前
QT程序实现串口通信案例
开发语言·qt
Main. 242 天前
从0到1学习Qt -- 常见控件之显示类控件
qt·学习
qq_401700412 天前
Qt中事件循环与并发机制的协同工作
qt
shouchaobao3 天前
免费PDF工具:PDF转Word/Excel/图片+AI总结+合并拆分+OCR识别,多端无广告!
pdf·word·excel
南风微微吹3 天前
2026年最新国考《行测》《申论》历年真题及答案PDF电子版(2000-2025年)
pdf·国考
qq_401700413 天前
Qt Positioning 模块访问设备地理位置信息
开发语言·qt
闫有尽意无琼3 天前
银河麒麟v11 arm编译Qt creator8.0.2报错
开发语言·qt