用kimichat批量识别出图片版PDF文件中的文字内容

图片版的PDF文件,怎么才能借助AI工具来提取其中全部的文字内容呢?

第一步:将PDF文件转换成图片格式

具体方法参见文章:《零代码编程:用kimichat将图片版PDF自动批量分割成多个图片》

第二步:识别图片中的文字

将第一步pdf转换成的图片,上传到kimichat

注意:kimichat目前上传图片一次最多50张图片,单个大小不超过100M

上传完成后,kimichat会进行解析。

部分图片会提示:未提取到文字或者解析失败

点击这些解析失败图片的右上角红色X,把这些无法解析的图片删除掉

然后回车,就全部识别出来到了。但是,识别的顺序不是按照文件标题名来的,有些乱,可以让kimichat调整下:

请按照图片标题顺序排列

Kimichat最终的输出结果:

当然,根据您提供的图片标题顺序,这里是整理后的文字内容:

  1. **page_5.png:**
    • I'll Be α
    • COWBOY
    • Anita Bijsterbosch
    • Clavis
    • NEWYORK
  2. **page_6.png:**
    • "Mommy, there's a party at school
    • tomorrow, and we get to wear
    • costumes!" Sammy says.
  3. **page_8.png:**
    • "I think I'll be
    • a cowboy.
    • lasso"
  4. **page_9.png:**
    • cowboyhat
    • Shirt .........
    • vest
    • ....
    • Fringed pants
    • cowboy boots
    • spurs
  5. **page_10.png:**
    • "Yee-Haw!"
  6. **page_12.png:**
    • "Or wait, I'll go as
    • a firefighter."
    • dragon
    • walkie-talkie
    • Fire engine
    • Flashlight
  7. **page_13.png:**
    • helmet
    • Firefighter suit
    • gloves
    • Firefighter boots
  8. **page_15.png:**
    • "Fire!"
  9. **page_16.png:**
    • "Hmm, perhaps
    • I'll be a pirate."
    • parrot
    • JollyRoger
    • treasure map
    • treasure chest
    • spyglass
  10. **page_17.png:**
    • bandana
    • eyepatch
    • striped T-shirt
    • ......
    • belt
    • trousers
    • buccaneer
    • boots
  11. **page_19.png:**
    • Land
    • ho!"
  12. **page_20.png:**
    • "Or I could
    • gc
    • as a knight.
    • castle
    • horse
    • cuddly toy
    • Feather
    • dragon
    • Sword"
  13. **page_21.png:**
    • helmet
    • armor
    • shield
    • gauntlet
    • boots
  14. **page_23.png:**
    • Tan-tan-tara!
  15. **page_24.png:**
    • "I could be
    • a magician...
    • wand"
  16. **page_25.png:**
    • magic hat
    • OD
    • boots
  17. **page_26.png:**
    • "+"
  18. **page_27.png:**
    • Abracadabra!
  19. **page_28.png:**
    • "Or maybe
    • I should
    • just go
    • as myself?"
  20. **page_29.png:**
  • T-shirt

  • overalls

  • boots

这些文字内容似乎是从一本关于职业和角色扮演的儿童书中提取的。如果您需要进一步的信息或帮助,请随时联系我。

相关推荐
程序视点2 小时前
PDF转Word免费工具!批量处理PDF压缩,合并, OCR识别, 去水印, 签名等全功能详解
pdf·pdf压缩·pdf编辑软件·pdf转换器·免费pdf工具·pdf转word免费工具·批量处理pdf的软件推荐
mixiumixiu14 小时前
免费 PDF 转 Word 工具:无水印 / 支持批量转换,本地运行更安全【附工具下载】
pdf
Humbunklung17 小时前
C# WPF 实现读取文件夹中的PDF并显示其页数
pdf·c#·wpf·npoi·gemini·itext
全栈技术负责人1 天前
前端静态资源优化
前端·性能优化·pdf
SEO-狼术2 天前
Find Content Fast in PDF Documents
pdf
Hi202402172 天前
支持OCR和AI解释的Web PDF阅读器:解决大文档阅读难题
pdf·flask·llm·ocr·阅读器
VB5942 天前
《考研 考证 各学科 各专业 思维导图汇总》PDF 5.2GB
考研·pdf
软件工程小施同学3 天前
计算机学报 2025年 区块链论文 录用汇总 附pdf下载
pdf·区块链
VB5943 天前
《中国传世名画》《中国传世山水画》《中国传世人物画》百科全书式的中国名画,PDF,294M
pdf
家庭云计算专家3 天前
ONLYOFFICE深度解锁系列.13-如何复制、重新排序 PDF 页面:onlyoffice 9.0.3 新功能
pdf·onlyoffice·协作空间·onlyoffice开发版·onlyoffice新功能·onlyoffice开发者版