[형태소분석]어절의 구성(http://yiunsr.tistory.com/731) 에서 단일어가 아니면 조사나 어미로 종결하는 것을 볼 수 있었다. 조사와 어미의 경우 개수가 제한되어 있고, 신조어도 적기 때문에 분해하기 쉬어 보인다. 


조사의 종류는 아래와 같다. 

격조사 : 어절의 성격을 나타내는 조사이다. 문장성분(주어, 목적어, 서술어, ...)로 구별할 수 있게 한다.

격조사는 주격 조사, 서술격 조사(관점에 따라서 지정사로 분리하기도 한다. ), 관형격 조사, 목적격 조사, 부사격 조사, 호격 조사(물건이나 상대방을 부르는 말로, 독립어가 되게 한다. ), 인용격 조사(다른 사람의 말이나 속담, 격언등을 인용할 때)

   격조사는 체언이나 체언 역할을 하는 말("이건 먹기가 아깝다."에서 처럼  용언+기/ㅁ 같은 경우 체언 역할을 할 수 있다.)

접속조사 : 두 단어를 이어줌(과,와... 같은 조사), 체언이나 체언 역할을 하는 말뒤에 붙는다.

보조사 : 체언이나 부사, 어미 뒤에 붙어서 여러의미를 전달하는 조사이다. 
체언이나 체언 역할이 없는 경우에도 붙을 수 있다.  ~것인가를(것/NNB + 이/VCP + ㄴ가/EC + 를/JX) ,  빨리도(빨리/MAG+도/JX) 이런 식으로 붙을 수 있다.

보조사를 조금 더 나누면

종결보조사 문장의 종결 어미 뒤에만 쓰이는 보조사, 잘됐구먼그래 에서 그래 (참고 : 네이버사전 http://krdic.naver.com/detail.nhn?docid=34540800 )

통용보조사 : 체언이나 부사 및 용언의 종결 어미에 두루 붙는 보조사. 높임을 나타낼 때 사용하는 "요" 같은 말, 그래 , 나는 ( 참고 : 네이버사전 http://krdic.naver.com/detail.nhn?docid=39679800 )

성분보조사 : 위에 것 나머지. 격조사 처럼 문장성문을 만든다는 것으로 보임.



주의가 필요한 부분이 있는데, 접속조사 와, 과, 랑 같은 경우 보조사와 혼동이 될 수 있다. 철수와 영희가 같이 갔다. 의 와의 경우 접속조사 이지만

철수와 같이 갔다. 에서의 와는 보조사로 해석한다. 대칭적행위대상이라는 보조적인 의미가 포함되어 있기 때문이다.

이 형태소 분석을 위해서는 다음 어절이 꼭 필요하다.


주격조사, 보격조사도 다음 어절에 따라서 주격조사가 될 수도 있고, 보격조사가 될 수도 있다. 우리나라에서 보어는 되다, 아니다, 라는 말을 보충할 때이다. 이런게 없으면 주격조사이다.


경우에 따라서는 부사격조사를 다시 여러 성분으로 나누기도 한다. 우선 내 기준으로는 이 정도면 충분할 것 같다. 더 들어가면 ~에 같은 조사에 대해서 너무 많은 가능성이 나와서 형태소 분석기가 복잡해 질 것 같다.


통용보조사 '요' 의 경우 어미뒤에 사용되는 경우 어미로 보기도 한다. 안녕하세요. 의 경우 "세요"로 묶어 그냥 어미로도 볼 수 있다.





조사를 분류하기에 따라서는 복합조사를 고려해볼 수 있다. 복합조사는 "회사에만 가면 졸리다." 에서의 에만 같은 것이다. 이를 통으로 볼수도 있지만 에만을 에/JKB+만/JX 처럼 부사격조사와 보조사로 이루어졌다고 생각할 수 있다.


복합조사의 경우 결합되는 case 가 한정되어 있고, 음절수가 적어서 오분석 될 수 있으므로 미리 기분석 사전을 만들어 두는 형태가 좋을 것 같다.


기분석사전을 만들어두어도 오류는 피하기 어렵다. 경우에 따라서는 같은 어절도 같은 문장이라도 2개의 뜻이 나올 수 있다.


김해서는 상남자다.

이 뜻은 앞에 주어가 생략되었고 (나는) 김해지역에서는 상남자라는 뜻이 있을 수 있다.

이 때는 김해서는 => 김해/NNP + 서/JKB + 는/JX 이라고 복합조사로 분석할 수 있다.


경우에 따라서는 "김해서"가 사람이름일 수도 있다. 김해서라는 사람은 상남자라고 생각할 수도 있다. 이 경우 김해서는 => 김해서/NNP + 는/JX 로 분석할 수도있다.


사실 이런 경우는 앞뒤 문장 문맥이 있지 않는한 분석하기 어렵다.


어째든 조사외형태소 + 조사 가 결합시 여러후보가 생성될 수 있음을 고려해야 한다. 하나의 후보가 생성된다고 해서 끝내만 안되고 가능한 여러 후보를 생성해야 한다.




참고 :

(https://ko.wikipedia.org/wiki/%EC%A1%B0%EC%82%AC_(%ED%92%88%EC%82%AC)


수정 1 : 보조사 세부 내용 추가