MixTeX - 支持CPU推理的多模态LaTeX OCR

文章目录


一、项目概览

MixTeX是一款创新的多模态LaTeX识别小程序,支持本地离线环境下的高效CPU推理。

无论是LaTeX公式、表格还是混合文本,MixTeX都能轻松识别,并支持中英文处理。



相关资源


核心特性

1、LaTeX公式识别

准确识别复杂的LaTeX数学公式,确保数学表达式准确性

2、表格识别

高效处理并识别各类表格,生成对应的LaTeX表格代码

3、混合文本识别

同时处理包含文字、公式和表格的文本,保证识别结果的完整性

4、双语支持

支持中文和英文的高精度识别,满足不同语言环境需求


技术特点

  • 本地离线推理,无需网络连接
  • 轻量级设计,程序启动文件仅约50MB
  • 高效运行,模型加载后运行极快
  • 无需GPU,仅需CPU即可运行

二、安装

bash 复制代码
cd mixtexgui
conda create -n mixtex python=3.10.14
conda activate mixtex
pip install -r requirements.txt
pyinstaller mixtex_ui.spec

三、使用说明

1、剪贴板图片识别 :按Win+V启用剪贴板功能

2、截图识别:使用Windows截图工具或键盘截图键


环境要求

推荐LaTeX配置:

latex 复制代码
\documentclass{ctexart}
\usepackage{amssymb}
\usepackage{amsmath}
\usepackage{stmaryrd}
\usepackage{color}

四、版本更新

v1.0.1 修复文件复制问题

v1.0.2 解决高色域显示器兼容问题

v1.1.2 优化花括号和表格识别

v2.1.2 支持手写文本混合公式

v2.2.3 支持黑色背景识别

v3.2.4 支持多选题OCR,优化多行公式处理


五、当前限制

  • 仅支持清晰印刷体中英文混合公式
  • 仅支持相对简单表格识别
  • 未来计划支持手写识别和多语言

伊织 xAI 2025-05-04(日)

相关推荐
___波子 Pro Max.5 分钟前
python list去重
python·list
狐凄2 小时前
Python实例题:基于边缘计算的智能物联网系统
python·物联网·边缘计算
@十八子德月生2 小时前
第十章——8天Python从入门到精通【itheima】-99~101-Python基础综合案例-数据可视化(案例介绍=JSON格式+pyecharts简介)
大数据·python·信息可视化·pycharm·echarts·数据可视化
W说编程2 小时前
算法导论第二十四章 深度学习前沿:从序列建模到创造式AI
c语言·人工智能·python·深度学习·算法·性能优化
动能小子ohhh3 小时前
html实现登录与注册功能案例(不写死且只使用js)
开发语言·前端·javascript·python·html
Blue桃之夭夭4 小时前
Python爬虫(六):Scrapy框架
爬虫·python·scrapy
大模型铲屎官4 小时前
【深度学习-Day 31】CNN基石:彻底搞懂卷积层 (Convolutional Layer) 的工作原理
人工智能·pytorch·python·深度学习·机器学习·cnn·llm
struggle20254 小时前
DeepForest开源程序是用于 Airborne RGB 机器学习的 Python 软件包
开发语言·python
杜大哥4 小时前
Python:.py文件如何变成双击可执行的windows程序?(版本1)
开发语言·windows·python
四川兔兔5 小时前
Pytorch 实战四 VGG 网络训练
人工智能·pytorch·python·深度学习·机器学习·回归·vgg网络