- 画像の自動分類・文字認識を行います
- ウェブサーバーとして動作し,ウェブブラウザ上から画像の閲覧やアプリケーションの操作が行えます
- このソフトウェアはウェブサーバーとして動作しますが,セキュリティを考慮して作っていないので,悪意のある人間から見える場所で動かさないでください
- Internet Explorer では動きません
Windows 8.1 64bit 版で動作を確認しています.その他の OS でも Node.js が動く環境であればどこでも動くと思われます.
- node.js をインストール https://nodejs.org/
(2019/11/13 現在の最新推奨版 12.13.0 LTS で動作確認しています) - ソースコードをダウンロードし,ソースコードの最上位ディレクトリ(package.json があるディレクトリ)でコマンドプロンプトまたは PowerShell を開いて以下を実行
> npm install > npx tsc > npx webpack
- ポートを指定して起動
> set PORT=80 > node esfilter
- 起動後作成される images/@unclassified ディレクトリに分類したい画像を入れておきます
- ESFilter が動作しているポートをウェブブラウザから開きます
- 「フィルター設定」>「フィルター一覧」>「新規作成」を押し,適当なフィルター名を入力します
- フィルターのパラメーターを入力します
- 条件は必要な数だけ追加でき,すべての条件を満たした画像(AND 条件)が,フィルターにヒットしたとみなされます
- OR 条件は指定できません.指定したい場合は必要な数だけ別にフィルターを作成してください
- 入力が完了してフィルター一覧に戻ったら,作成したフィルターを選択して画面下部の「単独で実行する」を押すとフィルターが実行されます
- フィルターを作成した後,フィルター一覧画面で一括実行したいフィルターを選択し,画面下部の「有効にする」を押します
- 画面上部「フィルターの自動実行」の「単発で実行する」を押すと,有効にしているすべてのフィルターが一括実行されます
- どのフィルターにもヒットしなかった画像は @unmatched フォルダーへ移動されます
- 「フィルターの自動実行」の「有効にする」を押すと,@unclassified フォルダーを継続的に監視して,新たに追加されたファイルに対しても自動でフィルターを実行します
- tessdata 以下に Tesseract の言語データ (*.traineddata) またはそれを圧縮したファイル (*.traineddata.gz) を入れると,文字認識に使用する言語データとして,フィルターの設定で指定できるようになります
- 標準で tesseract_best の jpn.traineddata と jpn_vert.traineddata を入れてあります
- 0.5.0 - 2020/11/15 - フィルターを最上位・最下位へ移動する機能,言語データを追加する機能,白抜き文字の認識を補助する機能の追加
- 0.4.2 - 2019/11/28 - ユーザーインターフェースの調整,バグ修正
- 0.4.1 - 2019/11/24 - ナビゲーションのリンクの修正
- 0.4.0 - 2019/11/24 - ユーザーインターフェースの調整
- 0.3.0 - 2019/11/23 - 文字色カラーピッカー,類似文字混同検索,画像をフォルダーごと未分類に戻す機能の追加,ベース URL を変更できるよう修正
- 0.2.0 - 2019/11/19 - 検索機能の追加
- 0.1.0 - 2019/11/17 - 文字認識機能の追加
- 0.0.1 - 2019/11/13 - 公開