技术栈

chandra

含老司开挖掘机
12 小时前
ocr·文档解析·结构化输出·chandra
Chandra OCR多格式输出详解:同页同步生成Markdown/HTML/JSON三版本你有没有遇到过这样的场景:Chandra 就是为解决这些“排版失真”痛点而生的。它不是把图片当文字流来识别,而是像人一样“看懂页面”:哪是标题、哪是正文、哪是两栏布局、哪是嵌套表格、哪是手写批注、哪是LaTeX公式——然后原样还原成结构化输出。
我是有底线的