信创模盒 ModelHub XC|高效适配最新国产全模态文字识别模型 DeepSeek-OCR

近日,范式信创模盒 ModelHub XC宣布,完成对最新国产全模态文字识别模型DeepSeek-OCR在信创算力卡上的适配测试,成为业内首批实现该创新OCR技术高效部署的平台。基于前期推出的面向信创算力的AI引擎体系EngineX的大模型推理框架,DeepSeek-OCR目前已经可以成功在昇腾、沐曦等芯片上稳定运行。

知识点预置

向上滑动阅览对话

大语言模型是什么?

像一个"饱读诗书的智者",它能与你对话、创作和推理

OCR是什么?

像一位"专业的文字翻译官",专攻将图片中的文字"认"出来,变成可编辑的文本

技术突破 DeepSeek-OCR的全新价值

近日,DeepSeek团队提出一种创新的OCR算法------DeepSeek-OCR,探索利用视觉模态作为高效压缩文本信息的新路径。核心在于借助视觉token对长文本上下文进行压缩,从而实现高效的光学字符识别(OCR)功能。该模型会将文本转化为二维图像形式,且在解码环节维持高识别精度,被业界普遍认为是破解大语言模型(LLM)长上下文效率难题的潜在关键突破。

攻坚克难 ModelHub XC平台的技术突破之路

为拓宽模型服务生态,ModelHub XC成功完成DeepSeek-OCR在信创算力计算环境的适配,测试验证能够稳定运行且输出效果无损,与NVIDIA输出效果一致,性能与NVIDIA H100差距在30%以内。

本次适配延续了平台已有的EngineX体系技术路线,通过"架构级适配"的技术路线实现对模型的支持。通过在EngineX引擎层完成对transformer算法架构的适配支持,能够最终完成对同一架构下多个大模型的批量化支持。在此基础上,DeepSeek-ORC的算法核心架构基于Transformer架构的模型,即可在国产信创算力平台上实现即插即用的高效推理与训练部署。

目前,社区已经将最新的支持 DeepSeek-ORC 模型的 EngineX 源代码发布,后续社区将会在更多的信创芯片上实现该模型的适配和优化。

链接:https://modelhub.org.cn/#/model/modeDetail?id=811

关于信创模盒 ModelHub XC

信创模盒 ModelHub XC 是面向信创算力生态的 AI 模型与工具社区,致力于推动国产硬件平台上的人工智能创新与落地,提供涵盖模型训练、推理到部署的全流程解决方案。

作为业内优质的国产化模型和算力开源社区,ModelHub始终致力于大小模型的统一管理与部署,除了提供丰富的大模型推理引擎支持以外,还对小模型(如asr、tts、ocr等)进行了深入支持,并提供了规范的小模型统一推理框架,使得小模型部署和调用进一步规范化、流程。此次DeepSeek-OCR的快速高效适配,再次证明了ModelHub平台在技术创新和服务能力上的高效优势,为用户提供了前沿的文本处理解决方案,助力企业在信息处理效率上实现新的飞跃。

---·END·---

关注范式官方账号

获取更多AI前沿洞察与产业实践案例

相关推荐
AI人工智能+6 天前
CNN+CRNN+NER:如何实现食品经营许可证秒级结构化信息提取?
深度学习·ocr·食品经营许可证识别
摆烂小白敲代码6 天前
腾讯云智能结构化OCR在物流行业的应用
大数据·人工智能·经验分享·ocr·腾讯云
开开心心就好10 天前
免费音频转文字工具,绿色版离线多模型可用
人工智能·windows·计算机视觉·计算机外设·ocr·excel·语音识别
开开心心_Every11 天前
全屏程序切换工具,激活选中窗口快速切换
linux·运维·服务器·pdf·ocr·测试用例·模块测试
2401_8362358611 天前
名片识别产品:技术要点与应用场景深度解析
人工智能·科技·深度学习·ocr
njsgcs13 天前
glm-ocr ollama使用 python
ocr
开开心心就好13 天前
轻松鼠标连, 自定义区域模仿人手点击
人工智能·windows·物联网·计算机视觉·计算机外设·ocr·excel
littleshimmer13 天前
基于 C++ + Qt6 实现一款本地离线 OCR 工具(SnapOCR)
ocr
AI周红伟15 天前
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建
大数据·人工智能·大模型·ocr·智能体·seedance
kongba00717 天前
如何在本地创建一个OCR工具,帮你识别文档,发票,合同等细碎的内容,并将结果给大模型整理格式输出。 经验工作流。给大模型生成代码就能直接跑。
大数据·ocr