ML,DL,LangChain/02_EDA와 MLP

IQR

  • -
IQR
Statistics · 통계

IQR

Interquartile Range · 사분위수 범위 탐험기 🔭

📊 IQR이 뭐예요?

전체 데이터를 크기 순으로 4등분할 때, 중간 50% 구간의 너비예요.

75번째 백분위수인 Q3에서 25번째 백분위수인 Q1을 빼면 구할 수 있어요!

👉 IQR = Q3 − Q1

🎯 왜 쓰나요?

평균(mean)은 극단값(이상치)에 크게 흔들려요.
하지만 IQR은 중간 50%만 보기 때문에 이상치의 영향을 거의 받지 않아요.

👉 데이터의 '진짜 퍼짐 정도'를 파악하고 싶을 때 딱이에요!

평균·표준편차 방법보다 극단값에 덜 민감해요
데이터가 정규분포를 따르지 않아도 사용할 수 있어요
📦 Box Plot
핵심 공식
IQR = Q3 Q1 =
중간 50% 데이터가 퍼진 범위예요 💜

📋 현재 데이터 (버튼 클릭하면 삭제돼요!)
IQR 내부 수염(정상범위) 이상치

🔥 이상치 판별 기준

📦 박스플롯 읽는 법

박스 = IQR 구간 (Q1 ~ Q3)
중앙선 = 중앙값 (Median)
수염(정상범위) = 울타리 안쪽 최솟·최댓값
주황 점 = 이상치 (outlier)

'ML,DL,LangChain > 02_EDA와 MLP' 카테고리의 다른 글

모델 학습 전체 파이프 라인  (0) 2026.03.10
교차 검증  (1) 2026.03.09
ROC Curve  (0) 2026.03.09
혼동행렬분석  (0) 2026.03.09
EDA(Exploratory Data Analysis: 탐색적 데이터 분석)를 위한 기본 개념  (0) 2026.03.09
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.