- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。
- 商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。
- 衆議院のウェブサイト「議案情報」では国会に提出された議案を確認できますが、検索や集計を行うには各ページに分かれたデータを整理する必要があります。
- そこでスマートニュース メディア研究所では、議案のデータを衆議院ウェブサイトから取得し、CSVやJSONなど機械判読可能なデータで公開するとともに、閲覧用のページを作成して自由に検索・集計できるようにしました。
- /dataにデータファイルを公開しています。原則としてCSVとJSONの両方で公開します。
- gian.csv / gian.json:すべての議案データを掲載したファイルです。途中経過も含むため、議案そのものの数よりも大きくなります。たとえば第150回国会に提出され、第151回で成立した議案は掲載回次「150」および「151」のデータが2行発生します。
- 掲載回次:議案が掲載された国会の回次。
- キャプション:議案情報ページのテーブルに付されたキャプション。
- 種類〜審議状況:それぞれ議案情報ページにあるテーブルの同名列。
- 経過情報 / 経過情報URL:議案情報ページにあるテーブル「経過情報」列のテキストとリンクURL。
- 本文情報 / 本文情報URL:議案情報ページにあるテーブル「本文情報」列のテキストとリンクURL。
- 議案種類〜議案提出の賛成者:それぞれ議案経過情報ページにあるテーブルの同名列。
- なお「議案提出回次」「議案番号」「議案件名」は、それぞれ「提出回次」「番号」「議案件名」と重複するため掲載していない。
- gian_summary.json:gianから掲載回次の重複を排除したもの。
- 提出回次、種類、番号、議案件名が同じものを同じ議案と判断しています。
- データ構造の関係からJSON形式だけで公開しています。
- gian_status.csv / gian_status.json:gianから「審議状況」のデータを集計したもの。
- gian_type.csv / gian_type.json:gianから「種類」のデータを集計したもの。
- gian.csv / gian.json:すべての議案データを掲載したファイルです。途中経過も含むため、議案そのものの数よりも大きくなります。たとえば第150回国会に提出され、第151回で成立した議案は掲載回次「150」および「151」のデータが2行発生します。
- 本プロジェクトのデータを閲覧・検索できるページを公開しています。
- URL: https://smartnews-smri.github.io/house-of-representatives/
- 「集計情報」では成立した/撤回された議案の数、議案を提出した国会議員、政党別の議案への賛否などの集計を見ることができます。
- また「議案検索」では議案の件名や提出者、賛成・反対した政党名などから議案を検索できます。検索結果だけを選んでダウンロードすることも可能です。
- すべてのデータとソースコードは自由に閲覧・ダウンロードが可能です。
- GitHubプロジェクトのライセンスはMITライセンスとしており、商用・非商用を問わずご自由にお使いいただけます。
- ソースコード等を引用する際の著作権表記は「スマートニュース メディア研究所」または「SmartNews Media Research Institute」としてください。
- なお、本プロジェクトの利用によって生じたいかなる損害についても、開発者およびスマートニュース株式会社は一切責任を負いません。