tldr: https://github.com/mayocream/koharu
文字检测模型用了基于 YOLOv5 和 DBNet 的 comic-text-detector ,OCR 模型用了基于 transformers 的 manga-ocr 。
程序用 Rust 和 Tauri 编写,界面用的是 React + Konva.js + TypeScript ;更详细可以看仓库的 README 。

程序支持兼容 OpenAI API 的任何后端,比如 LM Studio ,使用时注意打开 CORS 。
准备加上 segment 和 inpaint 功能,还在施工中……
刚学 Rust 三个月,写出来的第一个程序,还望轻喷 orz
