반응형
한국어 문법 짚고 넘어가기
한국어 NLP 를 위하여 한국어 문법에 대해 조금 더 자세히 알아보도록 한다.
- 한국어의 상,하 개념 :
문단 > 문장 > 구절(구,절) > 어절 > 단어 > 형태소 > 음절 > 음운(음소,운소)
1. 음운
말의 뜻을 구별해 주는 소리의 가장 작은 단위. 음운 = 음소 + 운소
- 음소
- 더 이상 작게 나눌 수 없는 음운론상의 최소 단위
- 국어의
자음
,모음
- 운소
- 단어의 의미를 분화하는 데 관여하는 음소 이외의 운율적 특징
- 음의 높낮이, 길이, 세기
* 자소와 음소
- 자소 : 글자 상의 분절표기 요소
- 음소 : 발음 상의 분절음 요소
- ex) 국물 : ㄱㅜㄱㅁㅜㄹ
- 발음 상으로는 ㄱㅜㅇㅁㅜㄹ
- 자소 'ㄱ'은 음소 'ㄱ', 'ㅇ'와 대응
2. 음절
- 하나의 종합된 음의 느낌을 주는 말소리의 단위
- 몇 개의 음소로 이루어지며, 모음은 단독으로 한 음절이 되기도 함
- ex)
밥을 먹는다
:바
블
멍
는
다
3. 형태소
의미를 가지고 있는 문법 요소 중 가장 작은 단위. 더 나누면 뜻을 잃는다.
ex) 사람만이 쌀밥을 먹었다.
자립 형태소
- 다른 형태소의 도움을 받지 않고 자유롭게 단어 형성에 참여할 수 있는 형태소
- ex)
사람
쌀
밥
- ex)
- 다른 형태소의 도움을 받지 않고 자유롭게 단어 형성에 참여할 수 있는 형태소
의존형태소
- 그 자체로 자립성이 없고 다른 형태소에 의존해야만 쓰일 수 있는 형태소
- ex)
만
이
을
먹-
-었-
-다
- ex)
- 그 자체로 자립성이 없고 다른 형태소에 의존해야만 쓰일 수 있는 형태소
실질형태소
- 구체적인 대상이나 동작, 상태와 같은 어휘적 의미를 표시하는 형태소
- ex)
사람
쌀
밥
먹-
- ex)
- 용언의 어간이 실질 형태소에 속한다.
- 구체적인 대상이나 동작, 상태와 같은 어휘적 의미를 표시하는 형태소
형식형태소
- 실질 형태소에 붙어 주로 말과 말 사이의 긴으을 형식적으로 표시하는 형태소
- ex)
만
이
을
-었-
-다
- ex)
- 조사, 어미, 접사 등이 형식형태소에 해당된다.
- 실질 형태소에 붙어 주로 말과 말 사이의 긴으을 형식적으로 표시하는 형태소
합성어/파생어
합성어 : 실질형태소 + 실질형태소
- ex) 고무신(합성 명사), 곧잘(합성 부사), 재미있다(합성 형용사), 힘들다(합성 동사)
- 실질형태소와 어근은 다를 수도 있지만 대부분 동일
파생어 : 실질형태소 + 접미사 또는 접두사 + 실질형태소
- ex) 떨리다(동사+접미사), 짓밟다(동사+접두사)
위반하다
에서 -하다, -되다 는 접미사.어근/어간/어미
어근 : 단어를 분석할 때, 실질적 의미를 나타내는 중심이 되는 부분
- 조사를 제외한 다른 모든 품사들이 해당된다
- 명사, 대명사, 수사(하나, 둘), 부사(두근, 깡충), 관형사(새, 헌, 첫), 감탄사
어간 : 용언이 활용될 때 변하지 않는 부분
- 동사, 형용사, 서술격 조사에서 나타난다.
어미 : 용언 및 서술격 조사가 활용하여 변하는 부분
- 용언이 활용될 때 변하는 부분은 어미, 변하지 않는 부분은 어간으로 이해
- ex) 멋지'다', 멋지'고', 멋지'니', 멋지'어서', 멋지'ㄴ'
4. 단어
분리하여 자립적으로 쓸 수 있는 말
뜻을 가지고 홀로 쓰일 수 있는 말 + 자립할 수 있는 말의 뒤에 붙어서 문법적 기능을 나타낸다. 자립/의미 유무로 나눈다.
5. 어절
문장을 구성하고 있는 각각의 마디. 문장 성분의 최소 단위로서 띄어쓰기 단위
6. 구절
구 + 절
구 : 문장 내에서 두 개 이상의 단어로 이루어져 주어와 술어 관계가 없는 덩어리
- 저기 사진을 찍는 사람이 내 친구야 :
저기 사진을
- 두 개의 어절이 합쳐졌지만 주어와 서술어의 관계는 아니다
- 명사구, 동사구, 형용사구, 관형사구, 부사구
- 저기 사진을 찍는 사람이 내 친구야 :
절 : 주어와 서술어 관계가 이루어진 말
- 날씨가 좋으니 기분도 좋다 :
날씨가 좋으니
- 관형절, 명사절, 부사절, 인용절, 서술절
- 날씨가 좋으니 기분도 좋다 :
7. 문장
생각이나 감정을 말로 표현할 때 완결된 내용을 나타내는 최소 단위
8. 문단
여러 문장이 모여 하나의 중심 생각을 나타내는 덩어리
반응형
'Paper review > NLP' 카테고리의 다른 글
[논문 리뷰] Multi channel CNN for Korean Sentiment Analysis (0) | 2020.06.14 |
---|---|
[논문 리뷰] Character Aware Neural Language Models (0) | 2020.06.14 |
토큰화 : Tokenize (0) | 2020.04.12 |