ずとまよ文字を認識するやつ/ゴリゴリTesseract使ってる
サイト上で動きます↓
https://geum-ztmy.github.io/zutomayo_OCR/
一部の機種はカメラ非対応かもです
法に触れるようなことはしないでね/僕はなんも責任取らないよ
- https://github.com/nguyenq/jTessBoxEditor からjTessBoxEditorのzipをDL,解凍 -> cd jTessBoxEditor
- Tesseract/PyOCRを入れる
- 環境変数設定 (自分は export TESSDATA_PREFIX="/usr/local/Cellar/tesseract/5.3.2/share/tessdata")
- 起動 java -Xms128m -Xmx1024m -jar jTessBoxEditor.jar &
- がくしゅうでーたとかつくってがくしゅう(->参考b)
- ztmy.traineddataができたらもう完成みたいなもん
- あとはOCRするだけ(->参考a)
- 以上
a. https://danglingfarpointer.hatenablog.com/entry/2015/01/28/215629
b. https://www.tdi.co.jp/miso/tesseract-ocr
サイトにするのに参考:
https://qiita.com/keito1024/items/dff19c95ca7c9b6c5d0c
https://qiita.com/quiye/items/2bb69e009bd12ea72f8c
https://github.com/jeromewu/tesseract.js-custom-traineddata
https://qiita.com/tinymouse/items/8b82f3578e167627d209