SKKU_TNT 19-2학기 co deeplearning 프로젝트.
code flow : dataCrawl -> preprocess -> LDA -> summarization
전체 프로세스를 진행하는 script
query 정보는 필수로 입력
(ex. 현대자동차, 11번가 등의 검색할 키워드 / 원하는 결과 조합 가능 : 현대자동차+취업)
def define_argparser():
parser = argparse.ArgumentParser(description = 'main argparser')
parser.add_argument('--max_page',required=False,default=50,help= 'crawling을 실시할 페이지 수')
parser.add_argument('--query',required=True, help='crawling을 실시할 검색어 명')
parser.add_argument('--s_date',required=False, default='2019.01.01',help='crawling을 실시할 시작 날짜')
parser.add_argument('--e_date',required=False, default='2019.03.31',help='crawling을 실시할 끝 날짜')
parser.add_argument('--result_path',required=False, default='C:/Users/rnfek/hanseok/Korean_News_summarization/',help='crawling을 완성한 파일을 저장할 위치')
# parser.add_argument('--file_name', required=True, help='요약을 진행할 txt파일명을 입력하시오.')
parser.add_argument('--index', required=False, default=0, type=int, help='요약을 진행할 txt파일의 index를 입력하시오.')
parser.add_argument('--number', required=False, default=2, type=int, help='결과로 제시할 문장 수를 입력하시오.')
args = parser.parse_args()
return args
- git clone https://github.com/Hanseok-Oh/Korean_News_summarization.git
- move to directory
- python main.py --query 검색어