- Python 3.4.3
- requests 2.9.1
- requests_oauthlib 0.6.1
上記の依存モジュールは以下でインストールできます。
pip install -r requirements.txt
- このリポジトリをクローン
git clone https://github.com/tmu-nlp/TwitterCorpus.git
- Twitter developersへログインし、認証キーを入手する(参考:http://hello-apis.blogspot.jp/2013/03/twitterapi.html)
- OAuthKey.ini内のアスタリスクを取得した認証キー4種類に書き換える
CK: Consumer key, CS: Consumer secret, AT: Access Token, AS: Access Token Secret - init.pyを実行
python init.py
上記手順で出力されたannotated.txt
がアノテーションされたツイッターコーパスです。
- Twitter APIを利用してツイートデータを取得しているため、アカウントに鍵がかかったり、ツイートが削除されていたりしてデータサイズが変わることがあります。