ohakutsu/zutomayo_OCR

ずとまよ文字を認識するやつ/ゴリゴリTesseract使ってる

HTMLMIT

zutomayo_OCR

ずとまよ文字を認識するやつ/ゴリゴリTesseract使ってる
サイト上で動きます↓
https://geum-ztmy.github.io/zutomayo_OCR/

注意

一部の機種はカメラ非対応かもです
法に触れるようなことはしないでね/僕はなんも責任取らないよ

備忘録

https://github.com/nguyenq/jTessBoxEditor からjTessBoxEditorのzipをDL,解凍 -> cd jTessBoxEditor
Tesseract/PyOCRを入れる
環境変数設定 (自分は export TESSDATA_PREFIX="/usr/local/Cellar/tesseract/5.3.2/share/tessdata")
起動 java -Xms128m -Xmx1024m -jar jTessBoxEditor.jar &
がくしゅうでーたとかつくってがくしゅう(->参考b)
ztmy.traineddataができたらもう完成みたいなもん
あとはOCRするだけ(->参考a)
以上

参考:

a. https://danglingfarpointer.hatenablog.com/entry/2015/01/28/215629
b. https://www.tdi.co.jp/miso/tesseract-ocr

サイトにするのに参考:
https://qiita.com/keito1024/items/dff19c95ca7c9b6c5d0c
https://qiita.com/quiye/items/2bb69e009bd12ea72f8c
https://github.com/jeromewu/tesseract.js-custom-traineddata
https://qiita.com/tinymouse/items/8b82f3578e167627d209