본문 바로가기

Learning/Measuring

F1 score

반응형

분류 모델을 만들어 성능을 평가해야할 때, 어떠한 모델이 더 성능이 좋은지를 판단하려면 기준이 되는 지표가 필요합니다. 이러한 지표 중 대표적인 것이 F1 score(F-measure)입니다. F1 score를 계산하기 위해서는 precision, recall, accuracy에 대한 개념을 알아야 합니다.

우선 다음과 같이 A,B,C,D가 있다고 합니다. 각각은 실험을 진행했을 때 결과의 True/False에 따라 나뉘어 집니다.

  • A : 실제 정답이 True & 실험 결과 True (TT)
  • B : 실제 정답이 True & 실험 결과 False (TF)
  • C : 실제 정답이 False & 실험 결과 True (FT)
  • D : 실제 정답이 False & 실험 결과 False (FF)

 

precision

실험 결과 True라고 판명된 것 중에서 실제로도 정답이 True인 것의 비율입니다. 

$precision = \frac{A}{(A+C)}$

 

recall

실제 정답이 True인 것중에 실험 결과 True라고 판명된 것의 비율입니다.

$precision = \frac{A}{(A+B)}$

 

accuracy

전체 실험 결과 중에서 정답의 비율을 말합니다.

$precision = \frac{A+D}{(A+B+C+D)}$

 

F1 score

따라서 F1 score 은 precision과 recall에 대해 평균을 구한 다음 가중치를 곱해 계산합니다.

$precision = 2 * \frac{precision * recall}{(precision + recall)}$

반응형

'Learning > Measuring' 카테고리의 다른 글

mAP  (0) 2020.04.12
평가지표  (0) 2020.04.12