/TwitterCorpus

首都大日本語 Twitter コーパス

Primary LanguagePython

首都大日本語 Twitter コーパス

Requirements

  • Python 3.4.3
  • requests 2.9.1
  • requests_oauthlib 0.6.1

上記の依存モジュールは以下でインストールできます。
pip install -r requirements.txt

Downloads

  1. このリポジトリをクローン
    git clone https://github.com/tmu-nlp/TwitterCorpus.git
  2. Twitter developersへログインし、認証キーを入手する(参考:http://hello-apis.blogspot.jp/2013/03/twitterapi.html)
  3. OAuthKey.ini内のアスタリスクを取得した認証キー4種類に書き換える
    CK: Consumer key, CS: Consumer secret, AT: Access Token, AS: Access Token Secret
  4. init.pyを実行
    python init.py

上記手順で出力されたannotated.txtがアノテーションされたツイッターコーパスです。

Notes

  • Twitter APIを利用してツイートデータを取得しているため、アカウントに鍵がかかったり、ツイートが削除されていたりしてデータサイズが変わることがあります。