한자-한글 변환기에서 사용되는 모듈입니다.
사용 하시다가 빠진 한자 또는 틀린 독음을 발견하시면 이 링크를 통해 제보해주세요. 확인 후 반영하도록 하겠습니다. GitHub을 통해 직접 PR을 보내주셔도 좋습니다.
pip install hanja
>>> import hanja
>>> from hanja import hangul
>>> hangul.separate('가')
(0, 0, 0)
>>> hangul.separate('까')
(1, 0, 0)
튜플(tuple)의 마지막 원소가 0이면 종성이 없는 글자라고 판단할 수 있다.
>>> hangul.separate('한')
(18, 0, 4)
'ㅎ'은 19번째 자음, 'ㅏ'는 첫번째 모음, 'ㄴ'은 다섯번째 자음이라는 것을 알 수 있다.
>>> hangul.build(0, 0, 0)
'가'
>>> hangul.is_hangul('가')
True
>>> hangul.is_hangul('a')
False
리스트가 아닌 제네레이터(generator)를 반환한다.
>>> '|'.join(hanja.split_hanja('大韓民國은 **共和國이다.'))
大韓民國|은 |**共和國|이다.
>>> [x for x in hanja.split_hanja('大韓民國은 **共和國이다.')]
['大韓民國', '은 ', '**共和國', '이다.']
>>> hanja.is_hanja('韓')
True
>>> hanja.is_hanja('한')
False
치환 모드 변환:
>>> hanja.translate('大韓民國은 **共和國이다.', 'substitution')
'대한민국은 민주공화국이다.'
혼용 모드 변환 (text):
>>> hanja.translate('大韓民國은 **共和國이다.', 'combination-text')
'大韓民國(대한민국)은 **共和國(민주공화국)이다.'
혼용 모드 변환 version 2 (text):
>>> hanja.translate('大韓民國은 **共和國이다.', 'combination-text-reversed')
'대한민국(大韓民國)은 민주공화국(**共和國)이다.'
혼용 모드 변환 (HTML):
>>> hanja.translate(u'大韓民國은 **共和國이다.', 'combination-html')
'<span class="hanja">大韓民國</span><span class="hangul">(대한민국)</span>은 <span class="hanja">**共和國</span><span class="hangul">(민주공화국)</span>이다.'