4.7K Star!OCR 和 AI 的结合让漫画/图片翻译更简单了!

今天这一期的分享适合喜欢二次元的朋友们,当你拿到一份曾经期望已久的漫画却发现,嗯?这语言不认识该怎么办?

今天推荐的这个开源项目 https://github.com/zyddnys/manga-image-translator 你一定要收藏好哦!该项目结合了 OCR 和 AI 技术可以翻译漫画/图片中的文字为你期望的语言。该项目在 Github 拥有 4.7K Star ✨✨✨。

示例

示例 1

这是一个原始的图片

这是翻译后的效果

示例 2

manga-image-translator 还支持去除气泡内的内容,并填充为空白,便于以后进行二次编辑。

这是一个原始的图片

这是去除气泡内的内容后的效果

翻译器支持

翻译器支持 gpt-3.5-turbo、gpt-4,但这都需要 OpenAI 的 API Key,可以尝试使用其它的,例如有道、百度的。

语言代码

makefile 复制代码
CHS: Chinese (Simplified)
CHT: Chinese (Traditional)
CSY: Czech
NLD: Dutch
ENG: English
FRA: French
DEU: German
HUN: Hungarian
ITA: Italian
JPN: Japanese
KOR: Korean
PLK: Polish
PTB: Portuguese (Brazil)
ROM: Romanian
RUS: Russian
ESP: Spanish
TRK: Turkish
VIN: Vietnames
ARA: Arabic
SRP: Serbian
HRV: Croatian
THA: Thai
IND: Indonesian
FIL: Filipino (Tagalog)

使用

如果想在线体验,请访问地址 https://cotrans.touhou.ai/

也可以获取源代码在本地安装使用。

首先,确保安装了 Python 3.8 及以上版本,和相应的编译工具

shell 复制代码
# 确认 python 版本
$ python --version
Python 3.8.13
# 拉取仓库
$ git clone https://github.com/zyddnys/manga-image-translator.git
# 安装依赖
$ pip install -r requirements.txt

方式一:命令行执行

bash 复制代码
# --use-gpu:果机器有支持 CUDA 的 NVIDIA GPU,可以添加 `--use-gpu` 参数
# --mode batch:批量模式翻译
# --verbose:打印调试信息并在结果中保存中间图像
# --translator=google:指定翻译器
# --target-lang:指定目标翻译语言
# 结果会存放到 `<图片文件夹路径>-translated` 文件夹里
$ python -m manga_translator --mode batch --verbose --use-gpu --translator=google --target-lang=CHS -i <图片文件夹路径>

方式二:浏览器执行

bash 复制代码
# 使用 `--mode web` 开启 Web 服务器模式
# 程序服务会开启在 http://127.0.0.1:5003
$ python -m manga_translator --verbose --mode web --use-gpu

更多使用参数参考文档 https://github.com/zyddnys/manga-image-translator?tab=readme-ov-file#options

感兴趣的小伙伴可以去尝试下哦!如果喜欢请关注笔者,后续为您分享更多有趣 AI 工具!

相关推荐
华新嘉华DTC创新营销1 小时前
华新嘉华:AI搜索优化重塑本地生活行业:智能推荐正取代“关键词匹配”
人工智能·百度·生活
SmartBrain2 小时前
DeerFlow 实践:华为IPD流程的评审智能体设计
人工智能·语言模型·架构
l1t3 小时前
利用DeepSeek实现服务器客户端模式的DuckDB原型
服务器·c语言·数据库·人工智能·postgresql·协议·duckdb
寒月霜华4 小时前
机器学习-数据标注
人工智能·机器学习
九章云极AladdinEdu5 小时前
超参数自动化调优指南:Optuna vs. Ray Tune 对比评测
运维·人工智能·深度学习·ai·自动化·gpu算力
人工智能训练师6 小时前
Ubuntu22.04如何安装新版本的Node.js和npm
linux·运维·前端·人工智能·ubuntu·npm·node.js
cxr8287 小时前
SPARC方法论在Claude Code基于规则驱动开发中的应用
人工智能·驱动开发·claude·智能体
研梦非凡8 小时前
ICCV 2025|从粗到细:用于高效3D高斯溅射的可学习离散小波变换
人工智能·深度学习·学习·3d
幂简集成8 小时前
Realtime API 语音代理端到端接入全流程教程(含 Demo,延迟 280ms)
人工智能·个人开发
龙腾-虎跃8 小时前
FreeSWITCH FunASR语音识别模块
人工智能·语音识别·xcode