形態素解析を利用した個人情報マスクプログラム(通称 PMP) 【1.はじめに】------------------------------------------------------------------ この「形態素解析を利用した個人情報マスク・プログラム(通称 PMP)」は、オープンソ ースの形態素解析エンジンMeCabを使用してテキストファイル内の個人情報をマスクするた めの支援プログラムです。 【2.作者】---------------------------------------------------------------------- 堀口 裕正 (hiromasa-tky@umin.ac.jp) 【3.ライセンス】---------------------------------------------------------------- GNU 一般公衆利用許諾契約書(GNU General Public License:GPL) Version 3 本プログラムには、"GNU 一般公衆利用許諾契約書(GNU General Public License:GPL) Version 3"(以下GNU GPL)を適用します。このライセンスは次のような特徴を持ちます。 ・ソースコードが公開されている ・誰でも自由にプログラムの複製、頒布、改変ができる ・派生するソフトウェアにもGNU GPLを適用しなければならない ・GNU GPLのより詳しい内容はCOPYING.txt(英文)をご覧ください。 他の団体・プロジェクト等で作成されたプログラムについて このパッケージには、本プログラムを使用するために必要なもので、他の団体・ プロジェクト等で作成されたプログラムも同梱されています。 これらのプログラムの著作権は、それぞれのプログラムの作者が保有しています。 改変・再配布等の条件はそれぞれのプログラムのライセンスに従ってください。 同梱プログラム ・MeCab http://mecab.sourceforge.net/ ・Qt http://qt.nokia.com/ 1) MeCab(Version 0.98) MeCabは 京都大学情報学研究科?日本電信電話株式会社コミュニケーション科学基礎研 究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エン ジン。 2) Qt(キュート)(Version 4.7.1) ノルウェーのQtソフトウェア社によって開発された、C++言語で書かれたクロス・プラ ットフォームGUIツールキット。オープンソース版のライセンスはGPL。 【4.アーカイブ内容】------------------------------------------------------------ help.html ヘルプ・ファイル INSTALL.bat インストール・バッチ・ファイル PMP.exe 本アプリケーション本体 PMP.ini 本アプリケーションのiniファイル QtCore4.dll Qtのダイナミック・リンク・ライブラリ QtGui4.dll Qtのダイナミック・リンク・ライブラリ mingwm10.dll Qtのダイナミック・リンク・ライブラリ libgcc_s_dw2-1.dll Qtのダイナミック・リンク・ライブラリ PMP.qm 日本語用言語ファイル pluginsフォルダ Qtプラグイン srcフォルダ 本プログラムのソースファイル csrcフォルダ MeCab-0.98.exe MeCabバイナリ MeCab-0.98.tar.gz MeCabソース qt-sdk-win-opensource-2010.05.exe Qtソース docフォルダ NEWS.txt 変更履歴 readme.txt このファイル COPYING.txt GNU 一般公有使用許諾書 tmpフォルダ 作業用フォルダ 【5.インストール方法】---------------------------------------------------------- 1) PMP-x.x.zip(x.xはバージョン番号)ファイルの上でマウス右クリックします。 2)「すべて展開」を選択します。 ※メニューに「すべて展開」がない場合は、ダブルクリック等で解凍してください。 3) 展開ウィザードが開きますので、次へボタンを押下します。 4) ファイル展開先フォルダは、デスクトップ等適当なローカルフォルダを選択し、次へ ボタンを押下します。 ※本プログラムは、処理実行の際にインストール・フォルダにファイルをコピーして作業 しますので、ディスクに十分な空き容量があることをご確認ください。 ※ネットワーク上のフォルダに展開すると正しく動作しません。 5) 完了ボタンを押下します。 6) 展開されたフォルダ内の「INSTALL.bat」(拡張子が表示されない設定の場合は「INST ALL」と表示されます)をダブルクリックすると、最初にMeCabのインストーラが起動しま す。PMPを動作させるには、MeCabをインストールする必要があります。) 7) MeCabセットアップウイザードが表示されるので、以下の手順でセットアップします。 ・インストール中に使用する言語選択画面表示 → Japaneseを選択しOKボタンを押下する。 ・MeCabセットアップ・ウィザードの開始 → 次へボタンを押下する ・辞書の文字コードの選択 → SHIFT-JISを選択し次へボタンを押下する。 ・使用許諾書の同意 → 同意するを選択し次へボタンを押下する。 ・インストール先の指定 → デフォルトのまま次へボタンを押下する。 32ビット版OS → C:\Program Files\MeCab 64ビット版OS → C:\Program Files (x86)\MeCab 注意:インストールフォルダを変更した場合は、本アプリケーションの iniファイルに その旨記述する必要があります。 ・プログラムグループの指定 → デフォルトのまま次へボタンを押下する。 ・インストール準備完了 → インストール・ボタンを押下する ・MeCabセットアップ・ウィザードの完了 → 完了ボタンを押下する セットアップウイザードが閉じ、MeCabのインストールは終了です。 8) 「インストールを完了しました。続行するには何かキーを押してください。」と表示さ れますので、何かキーを押してください。 【6.起動方法】------------------------------------------------------------------ 展開されたフォルダ内の「PMP.exe」(拡張子が表示されない設定の場合は「PMP」と表示 されます)をダブルクリックすると、本プログラムが起動します。 【7.ファイル仕様】-------------------------------------------------------------- 個人情報をマスクした出力ファイルは、指定した出力フォルダにオリジナル・ファイル名 の末尾に.mskという拡張子をつけたファイル名で作成されます。 【8.iniファイル内容】----------------------------------------------------------- 1)MeCabのパス [MaCab] MaCab_HOME=C:/Program Files (x86)/MaCab/bin/ MeCabのパスが記述されています。 「\」を「/」に置き換えて記述してください。 MeCabは標準で下記のフォルダにインストールされます。 32ビット版OS → C:\Program Files\MeCab\ 64ビット版OS → C:\Program Files (x86)\MeCab\ 注意:MeCabのインストールフォルダを変更した場合は、記述を書き変えてください。 【記述例】MaCab_HOME=C:/Program Files (x86)/MyFolder/MeCab/ 2)マスク項目番号 [Target] MaskColumnNo= タブ区切りのテキスト・ファイルの特定の項目だけに個人情報が含まれる場合は、マスク 処理対象とする項目番号を指定することができます。 マスク項目番号を指定しない場合は、全文が処理対象となります。 3)タイムアウト時間 [Timeout] ProcessExecution=600 子プロセスとして実行するMeCabのタイムアウト時間を記述することができます。 【9.アンインストール方法】---------------------------------------------------------- 本プログラムをアンインストール方法は以下のとおりです。 本プログラムのフォルダ削除します。