/petitions

청와대 국민청원 데이터

Primary LanguagePythonMIT LicenseMIT

청와대 국민청원 사이트의 만료된 청원 데이터 모음.

데이터

petition.csv

  • 전체 데이터

petition_corrupted.csv

  • 전체 행 중에서 5%는 임의 필드 1개에 결측치 삽입
  • 범주(category)가 '육아/교육'이고 투표수(votes)가 50건 초과이면 20% 확률로 투표수에 결측치 넣기
  • 나머지는 전체 데이터와 동일

petition_sampled.csv

  • 전체 데이터 중 5%만 임의추출한 데이터

petition_corrupted_sampled.csv

  • 결측치가 삽입된 샘플 데이터
  • petition_corrupted.csv 파일에서 5%만 임의추출하여 생성

저작권

CSV 데이터의 저작권은 KOGL 제1유형을 따름.

  • 출처표시
  • 상업적, 비상업적 이용가능
  • 변형 등 2차적 저작물 작성 가능

소스 코드는 MIT License를 따름.

설치 및 실행

소스코드 받기:

git clone https://github.com/akngs/petitions.git
cd petitions

설치 (pipenv가 설치되어 있어야 합니다):

pipenv install

실행:

pipenv shell
python petition.py

생성된 데이터 확인:

tail data/*.csv