技术栈

文档多模态

山顶夕景
5 小时前
多模态·mllm·grpo·文档多模态
【MLLM】文档多模态MinerU2.5-Pro模型【文档多模态模型进展】MinerU2.5-Pro更新,主要特点是保留 MinerU2.5 的 1.2B 参数架构,主要改动点是训练数据从不足 1000 万页扩至 6550 万,工作报告在:MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale,https://arxiv.org/pdf/2604.04771, 代码在: https://github.com/opendatalab/MinerU, 模型权重在:
我是有底线的