/word_frequency_with_hashtag_split

word frequency 데이터를 활용한 복합 단어의 띄어쓰기 정확도를 맞추는 toy project

Primary LanguageJupyter Notebook

word_frequency_with_hashtag_split

word frequency 데이터를 활용한 복합 단어의 띄어쓰기 정확도를 맞추는 toy project

해당 word frequecy 데이터의 원본 링크 : https://www.kaggle.com/rtatman/english-word-frequency

해당 내용을 캐글에 게시한 링크 : https://www.kaggle.com/bluemumin/word-frequency-with-hashtag-split

원래 수행했던 내용은 500개의 단어에 대한 분리 정확도 산출이지만, 데이터가 비 공개이기 때문에 예시만 게시함

baseline(Hashtag Splitter) : https://github.com/matchado/HashTagSplitter/blob/master/split_hashtags.py

최적의 경우의 수 발견에 사용된 데이터 셋 : https://www.kaggle.com/rtatman/english-word-frequency

image