ML,DL,LangChain/02_EDA와 MLP

ROC Curve

  • -
ROC Curve
Binary Classification · 이진 분류

ROC Curve & AUC

Threshold를 움직여보세요 — 곡선 위의 점이 이동하며 TPR·FPR이 바뀌어요 ✨

📈 ROC Curve란?

Threshold(판단 기준값)를 0 → 1로 바꿔가며 그 때마다의
TPR(True Positive Rate)FPR(False Positive Rate)
찍은 곡선이에요.

Confusion Matrix가 하나의 threshold에서의 스냅샷이라면,
ROC Curve는 모든 threshold에서의 전체 성능을 보여줘요!

📐 AUC란?

ROC Curve 아래 면적(Area Under Curve)이에요.

AUC = 1.0 → 완벽한 모델 🟢
AUC = 0.5 → 동전 던지기 수준 (대각선) 🔴
AUC < 0.5 → 랜덤보다 나쁜 모델 ❌

하나의 숫자로 모델 전체 성능을 요약해줘서 모델 비교에 유용해요!

📈 ROC Curve 인터랙티브
0.85
TPR · Recall
TP / (TP + FN)
실제 양성 중 맞게 잡은 비율
= Y축
FPR
FP / (FP + TN)
실제 음성 중 잘못 양성 예측 비율
= X축
AUC 0.85
0.9↑ 매우 좋음 0.8~0.9 좋음 0.7~0.8 보통 0.7↓ 개선 필요
Threshold — 이 확률 이상이면 Positive로 판정 0.50
TPR
FPR
📖 핵심 개념 설명
📖 ROC Curve 읽는 법

📍 왼쪽 위 꼭짓점(0, 1)

FPR=0, TPR=1
완벽한 모델의 위치예요.
음성을 하나도 잘못 잡지 않으면서 양성을 전부 잡는 상태!

📍 대각선 (Random)

TPR = FPR인 선이에요.
동전 던지기 수준의 모델이 만드는 기준선.
곡선이 이 선보다 아래면 랜덤보다 나쁜 모델!

⚖️ Threshold를 낮추면?

더 많이 Positive로 예측
→ TPR ↑ (양성을 더 잘 잡음)
→ FPR ↑ (음성도 더 많이 잘못 잡음)
점이 오른쪽 위로 이동해요!

⚖️ Threshold를 높이면?

더 적게 Positive로 예측
→ TPR ↓ (양성을 덜 잡음)
→ FPR ↓ (음성 오탐도 줄어듦)
점이 왼쪽 아래로 이동해요!

🎯 최적 Threshold

보통 왼쪽 위 꼭짓점과 가장 가까운 점을 최적 threshold로 선택해요.
또는 Precision-Recall 균형을 보고 도메인에 맞게 결정해요!

📐 AUC를 쓰는 이유

Threshold에 상관없이 모델 자체의 판별력을 하나의 숫자로 요약해줘요.
서로 다른 모델을 비교할 때 특히 유용해요!

'ML,DL,LangChain > 02_EDA와 MLP' 카테고리의 다른 글

모델 학습 전체 파이프 라인  (0) 2026.03.10
교차 검증  (1) 2026.03.09
혼동행렬분석  (0) 2026.03.09
IQR  (0) 2026.03.09
EDA(Exploratory Data Analysis: 탐색적 데이터 분석)를 위한 기본 개념  (0) 2026.03.09
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.