97_api_intro_imagerecognition_pdf2word

通用 PDF OCR 到 Word API 数据接口

文件处理,OCR,PDF 高可用图像识别引擎,基于机器学习,超精准识别率。

1. 产品功能

  • 通用识别接口;
  • 支持中英文等多语言字符混合识别;
  • formdata 格式 PDF 文件流传参;
  • 基于机器学习不断提高的识别率;
  • 输出 Word 文件永久 CDN 存储;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;
  • 接口调用状态与状态监控

2. API 文档

接口详情: https://www.gugudata.com/api/details/pdf2word

接口地址: https://api.gugudata.com/imagerecognition/pdf2word?appkey={{appkey}}

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: https://api.gugudata.com/imagerecognition/pdf2word?appkey={{appkey}}

数据预览: https://www.gugudata.com/preview/pdf2word

接口测试: https://api.gugudata.com/imagerecognition/pdf2word/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
pdffile file YOUR_VALUE formdata 文件流

4. 返回参数

参数名 参数类型 备注
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
Data string 转换后的 Word 文档地址,咕咕数据同时提供永久 CDN 存储