このプロジェクトは、NHK for Schoolのウェブサイトから教育プログラムのあらすじ(アウトライン)をスクレイピングしてCSV形式で保存するPythonスクリプトです。
- NHK for Schoolの各プログラムのあらすじをスクレイピング
- 収集したデータをCSVファイルに出力
このスクリプトを実行する前に、Python3がインストールされていることを確認してください。
プロジェクトの依存関係を管理するために、Pythonの仮想環境を使用します。次の手順に従って仮想環境を設定し、必要なパッケージをインストールしてください。
python3 -m venv myenv # 新しい仮想環境を作成
source myenv/bin/activate # 新しい仮想環境をアクティベート
pip install -r requirements.txt # 必要なパッケージをインストール
セットアップが完了したら、以下のコマンドでスクリプトを実行します。
python scrape_nhk_for_school_outline_data.py
スクリプトはdataset_root/data/
ディレクトリにnhk_for_school_outline_data.csv
という名前のCSVファイルを生成します。このファイルには、スクレイピングしたデータが含まれます。