- アプリケーションidを取得する
https://e.developer.yahoo.co.jp/dashboard/ - カレントディレクトリに
setting.py
を作成して、アプリケーションIDを設定する
APPID = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
api仕様
exec_categories.py
を実行する。
-> all_categories.csv
に、カテゴリー3レベルのすべてのカテゴリが出力される。
api仕様
exec_reviews.py
を実行する。
-> all_reviews.csv
に、レビューデータが出力される。
all_reviews.csv
ヘッダカラム名 | 内容 |
---|---|
Description | レビューの本文 |
ReviewTitle | レビューのタイトル文(例:購入しました!) |
Rate | レビュー評価点 : 1.00(悪い)から5.00(良い) |
Average | レビュー平均点 |
CountAll | レビュー数 |
Recommend | レビューを見て役立った人の数 |
ReviewType | レビューの種類 : buyer(購入者)/other(クチコミ)/all(全員) |
Purpose | 購入目的 : daily(購入者)/hobby(趣味用途)/gift(プレゼント)/business(仕事用) |
SendTo | 誰用に購入したか : self(自分用)/family(家族親戚用)/friend(友人へ)/lover(彼氏彼女へ)/business(取引先へ) |
cat1_code | レベル1カテゴリid |
cat2_code | レベル2カテゴリid |
cat3_code | レベル3カテゴリid |
cat1_title_short | レベル1カテゴリ名 |
cat2_title_short | レベル2カテゴリ名 |
cat3_title_short | レベル3カテゴリ名 |
cat3_title_long | 親カテゴリを含むカテゴリ名 |
- APIの利用制限
- 中断、分割実行
- エラー、手動中断等理由を問わず、処理が中断されても、その中断したカテゴリIDから再開することが出来ます。
(カレントディレクトリに
中断.txt
というファイルが作成されています。) 中断.txt
を作成し、1行目にall_categories.csv
のカテゴリの行番号を指定すると、その次の行から実行出来ます。- 異なるアプリケーションIDで複数実行も出来ると思います。(試したことはない)
ディレクトリをアプリケーションIDごとにディレクトリを作って、all_categories.csv
を分割すると、並行で実行できると思います。
- エラー、手動中断等理由を問わず、処理が中断されても、その中断したカテゴリIDから再開することが出来ます。
(カレントディレクトリに