/NAMPreprogressing

National Assembly Minutes Preprogressing

Primary LanguageJupyter Notebook

국회 회의록 전처리

국회 회의록 데이터 수집 및 전처리 코드입니다.

Data

국회회의록

How to use

  1. hwp_crawling.py를 이용하여 회의록 한글파일(hwp)를 받는다.
  2. hwp 파일을 txt 파일로 변환 (해당 부분은 본 코드상에서 제공하지 않습니다)
  3. preprocessing.ipynb 파일을 이용하여 전처리