技术栈
chandra
含老司开挖掘机
12 小时前
ocr
·
文档解析
·
结构化输出
·
chandra
Chandra OCR多格式输出详解:同页同步生成Markdown/HTML/JSON三版本
你有没有遇到过这样的场景:Chandra 就是为解决这些“排版失真”痛点而生的。它不是把图片当文字流来识别,而是像人一样“看懂页面”:哪是标题、哪是正文、哪是两栏布局、哪是嵌套表格、哪是手写批注、哪是LaTeX公式——然后原样还原成结构化输出。
我是有底线的