要求
接近 1000 万张不同分辨率的图片,其中某个特定分辨率的大概有 300 万左右。
图片上固定位置有类似水印相机的附加文字。
对附加文字进行识别,用识别内容重命名图片,分文件夹归类整理。
一个查询工具,通过文字查询符合条件的图片,可预览可批量导出。
需要至少三个查询条件。
识别率要求至少 95%。越高越好。
现状
淘宝上找人用 PaddleOCR 跑了下,识别率只有 90%左右。已放弃。
希望能使用 PaddleOCR 或者其他类似开源项目继续优化将识别率提升上去。
如果开源项目实在不行,不排除使用阿里、百度之类付费 OCR 服务的可能。
做过 OCR 有兴趣的朋友请带 ID 加我: TW9ycm93bGVzcw==
谢谢大家。
