2020년/Development
Confusion matrix, Recall(재현율),Precision(정밀도), Accuracy(정확도)
위지원
2020. 10. 25. 19:57
통계적으로 유의미함의 여부를 결정하는 방법에는 Recall(재현율),Precision(정밀도), Accuracy(정확도)가 있다. 본 방법을 설명하기에 앞서 Confusion matrix를 알아야하는데, 이는 아래와 같다.
|
실제 답 |
||
True |
False |
||
분류 결과 |
True |
True Positive |
False Positive |
False |
False Negative |
True Negative |
이를 이용하여 재현율, 정밀도, 정확도를 계산할 수 있다.
Recall은 실제 답이True 인 것 중 True로 분류한 것의 비율이다. 공식은 다음과 같다.
True PositiveTrue /Positive+False Negative
Precision은 모델이 True로 분류한 것중 실제 True인 것의 비율이다.
공식은 다음과 같다.
True PositiveTrue/ Positive+False Positive
두 모델은 상호보완해 사용하여야 한다. False Positive를 극단적으로 줄여 True Negative를 상대적으로 올리는 경우를 피하기 위해서다. 예를 들어 충북대에 돌아다니는 사람 50명 중 확실하게 학생증을 목에 걸고 다니는 학생 2-3명만 예측하는 모델은 좋은 모델이 아니다.
Accuracy는 True와 False 모두 정확하게 예측한 경우다. 공식은 다음과 같다.
True Positive+True NegativeTrue /Positive+False Positive+False Negitive+True Negative