초성체 번역기 (Ver.2.1)

한국어 형태소 분석기 Kiwi를 개량하여 초성체를 해석하는 Kneser Ney 모델을 구축하였습니다. 이전 모델에 비해 문맥이나 문장을 예측하는데 강력한 특징을 보여줍니다. 이전 버전의 해석기가 필요하신 분은 여기를 클릭하십시오.

학습에 사용한 코퍼스는 세종계획말뭉치와 나무위키 텍스트 데이터이며, 구어(10MB), 문어(300MB), 위키(6GB)의 추론 모델을 구축하였습니다. 추론 모델이 커질수록 더 다양한 초성체를 잡아낼 수 있지만 로딩 및 추론 시간이 길어질 수 있습니다.

입력은 ㄱ~ㅎ까지의 초성과 띄어쓰기, 4종의 구두점(. , ! ?)만 가능하며 나머지 문자들은 인식하지 않습니다.

2.0버전에서는 최적의 유사한 결과들만 상위에 추천되는 한계가 있어서 다양한 경우를 살펴보기 어려웠습니다. 2.1버전에서는 이를 개선하여 정렬 순위에 다양성을 고려할 수 있도록 옵션을 추가하였습니다.

SEARCH

MENU NAVIGATION