반응형
분류 모델을 만들어 성능을 평가해야할 때, 어떠한 모델이 더 성능이 좋은지를 판단하려면 기준이 되는 지표가 필요합니다. 이러한 지표 중 대표적인 것이 F1 score(F-measure)입니다. F1 score를 계산하기 위해서는 precision, recall, accuracy에 대한 개념을 알아야 합니다.
우선 다음과 같이 A,B,C,D가 있다고 합니다. 각각은 실험을 진행했을 때 결과의 True/False에 따라 나뉘어 집니다.
- A : 실제 정답이 True & 실험 결과 True (TT)
- B : 실제 정답이 True & 실험 결과 False (TF)
- C : 실제 정답이 False & 실험 결과 True (FT)
- D : 실제 정답이 False & 실험 결과 False (FF)
precision
실험 결과 True라고 판명된 것 중에서 실제로도 정답이 True인 것의 비율입니다.
$precision = \frac{A}{(A+C)}$
recall
실제 정답이 True인 것중에 실험 결과 True라고 판명된 것의 비율입니다.
$precision = \frac{A}{(A+B)}$
accuracy
전체 실험 결과 중에서 정답의 비율을 말합니다.
$precision = \frac{A+D}{(A+B+C+D)}$
F1 score
따라서 F1 score 은 precision과 recall에 대해 평균을 구한 다음 가중치를 곱해 계산합니다.
$precision = 2 * \frac{precision * recall}{(precision + recall)}$
반응형