위지원의 데이터 일기 🐈
Home
  • 분류 전체보기 (564)
    • ✎ 2025년 (5)
    • 2024년 (16)
    • 2023년 (6)
    • 2022년 (35)
      • Developement (22)
      • Error (9)
    • 2021년 (68)
      • ERROR (9)
      • 알고리즘 (11)
      • 개발공부 (21)
      • Data (15)
      • 21.下 (12)
    • 2020년 (164)
      • 코테 (84)
      • Development (29)
      • 정처기 (41)
    • 2019년 (27)
    • 2018년 (89)
      • English Speaking (8)
      • Error (12)
      • C, Java, FileSystem (13)
      • DataBase (15)
      • Java (2)
      • 지식 (16)
      • Go (3)
      • spark (9)
      • 영어 (5)
      • 알고리즘 (6)
    • 2017년 (143)
      • Error (17)
      • machine learning (16)
      • Spark (20)
      • Database (19)
      • Python (17)
      • Spring (9)
      • etc. (10)
      • 백준 (5)
      • Google Platform (12)
      • web Development (7)
      • Docker (3)
      • Linux (8)
Home
  • 분류 전체보기 (564)
    • ✎ 2025년 (5)
    • 2024년 (16)
    • 2023년 (6)
    • 2022년 (35)
      • Developement (22)
      • Error (9)
    • 2021년 (68)
      • ERROR (9)
      • 알고리즘 (11)
      • 개발공부 (21)
      • Data (15)
      • 21.下 (12)
    • 2020년 (164)
      • 코테 (84)
      • Development (29)
      • 정처기 (41)
    • 2019년 (27)
    • 2018년 (89)
      • English Speaking (8)
      • Error (12)
      • C, Java, FileSystem (13)
      • DataBase (15)
      • Java (2)
      • 지식 (16)
      • Go (3)
      • spark (9)
      • 영어 (5)
      • 알고리즘 (6)
    • 2017년 (143)
      • Error (17)
      • machine learning (16)
      • Spark (20)
      • Database (19)
      • Python (17)
      • Spring (9)
      • etc. (10)
      • 백준 (5)
      • Google Platform (12)
      • web Development (7)
      • Docker (3)
      • Linux (8)
블로그 내 검색
포트폴리오

위지원의 데이터 일기 🐈

데이터를 사랑하고 궁금해하는 기록쟁이입니다! 😉 Super Data Girl이 되는 그날까지🏃‍♀️ 화이팅!

  • 🖥 깃블로그
  • 🌍 위키원
  • 📑 내맘대로 스크랩
  • 💌 메일
  • 2020년/Development

    Confusion matrix, Recall(재현율),Precision(정밀도), Accuracy(정확도)

    2020. 10. 25. 19:57

    by. 위지원

    통계적으로 유의미함의 여부를 결정하는 방법에는 Recall(재현율),Precision(정밀도), Accuracy(정확도)가 있다. 본 방법을 설명하기에 앞서 Confusion matrix를 알아야하는데, 이는 아래와 같다.

     

    실제 답

    True

    False

    분류 결과

    True

    True Positive

    False Positive

    False

    False Negative

    True Negative

     

    이를 이용하여 재현율, 정밀도, 정확도를 계산할 수 있다.

    Recall은 실제 답이True 인 것 중 True로 분류한 것의 비율이다. 공식은 다음과 같다.

    True PositiveTrue /Positive+False Negative

    Precision은 모델이 True로 분류한 것중 실제 True인 것의 비율이다.

    공식은 다음과 같다.

    True PositiveTrue/ Positive+False Positive

     

    두 모델은 상호보완해 사용하여야 한다. False Positive를 극단적으로 줄여 True Negative를 상대적으로 올리는 경우를 피하기 위해서다. 예를 들어 충북대에 돌아다니는 사람 50명 중 확실하게 학생증을 목에 걸고 다니는 학생 2-3명만 예측하는 모델은 좋은 모델이 아니다.

     

    Accuracy는 True와 False 모두 정확하게 예측한 경우다. 공식은 다음과 같다.

    True Positive+True NegativeTrue /Positive+False Positive+False Negitive+True Negative

    저작자표시 (새창열림)

    '2020년 > Development' 카테고리의 다른 글

    MaxOS에 Docker를 이용하여 TensorFlow설치하기  (0) 2020.12.01
    딥러닝 공부 #1  (0) 2020.12.01
    [PyTorch] 파이토치 써보기  (0) 2020.10.21
    [Kafka] #2 카프카를 써보자  (0) 2020.10.06
    [Kafka] #1 카프카를 알아보자  (0) 2020.10.06

    잠깐만요~! 읽으신김에 이런 글들은 어떠세요? 👀

    • MaxOS에 Docker를 이용하여 TensorFlow설치하기 2020.12.01
    • 딥러닝 공부 #1 2020.12.01
    • [PyTorch] 파이토치 써보기 2020.10.21
    • [Kafka] #2 카프카를 써보자 2020.10.06
    맨 위로
전체 글 보기
Tistory 로그인
Tistory 로그아웃
로그아웃 글쓰기 관리

열정! 열정! 열정! 🔥

Designed by Nana
블로그 이미지
위지원
데이터와 관련된 일을 모두 좋아합니다

티스토리툴바

티스토리툴바