Kiwi : 지능형 한국어 형태소 분석기

개요

가볍게 만들어 본 c++기반 한국어 형태소 분석기 Kiwi입니다. 현재 문학작품이나 신문기사 등의 텍스트에 대해 약 85% 성능을 보이며, 성능은 앞으로 더욱 개선될 예정입니다.

 

업데이트 내역

  • v0.1: 첫 릴리즈. 약 80% 정확도
  • v0.2: 정확도 85%까지 향상.
    상호정보량 맵을 이용하여 분석 모호성 감소
    서술격 조사 생략 추적 가능해짐
  • v0.3: 알고리즘 및 메모리 관리 최적화
    실행 속도 약 86% 향상. (0.14MB/s)
  • v0.4: 알고리즘 개선
    실행 속도 약 101% 향상. (0.28MB/s)

특징

외부 라이브러리 의존 없이 순수 C++로만 작성되어 어떤 환경에서도 사용할 수 있습니다.

사용자가 필요에 따라 사전 내용을 추가할 수 있습니다.

 

라이센스

LGPL v3

 

데모

결과 개수:
 
 

링크

자세한 개발기는 블로그, 소스코드 및 라이센스에 대해서는 https://github.com/bab2min/Kiwi 를 참조해주세요.

 

GUI버전

 

Kiwi GUI 버전을 배포합니다. 자세한 내용은 http://bab2min.tistory.com/586를 참조하세요.

SEARCH

MENU NAVIGATION