어제 인터넷을 검색하다가 공개된 한국어 형태소 사전리스트를 발견했다.
라이센스가 리에이티브 커먼즈 저작자표시- 동일조건변경허락 2.0 국제 라이선스(CC BY-SA) 이다. 꽤 오래전에 공개된 것으로 보이는데 이제야 발견했다.
해당 설명이 너무 부족해서 형태소 기호가 뭔지 모르겠으나 한나눔으로 추정된다. 고유명사 데이터도 많고, 고유명사내 따로 분류가 있는 것도 꽤 좋다. 그리고 분류도 세종성과물보다 더 상세하다. 다만 통계정보가 없다. 그래서 기종 세종성과물과 잘 결합해야 할 것 같다.
PS : 다시 잘 생각해보니 CC BY-SA 라는 라이센스 때문에 다른 성과물과 결합하기가 좀 문제가 있는 것 같다. 세종성과물은 CC BY-NC-ND 인데 두 라이센스가 호환이 안되기 때문에 둘이 결합하기 어려울 것 같다.