사람 1000명을 대상으로 특정 실험을 해서 0점부터 10점까지 점수로 결과를 나타낸다고 가정해 봅시다. 또한 0점은 거짓(병이라면 병이 걸리지 않은 사람), 10점은 참(병이 걸린 사람)을 의미한다고 칩시다.
각 점수별로 참과 거짓의 비가 나옵니다. 즉, 각 점수를 기준으로 했을 때 이 점수 이상은 병에 걸린 사람, 이 점수 미만은 병에 걸리지 않은 사람이라고 가정하는 거죠.
이 비율을 그래프로 그린 것이 ROC 커브입니다.
이를 sensitivity와 specificity의 비율이라 하네요.
가로축은 10- 0~10이 될 것이고(정규화한다면 1-0~1이 되겠네요) 세로축은 0~100%가 되겠죠. 만약 1점을 기준으로 1점 이상 받은 사람이 800명, 1점 미만 받은 사람이 200명이라면 x축이 10-1(정규화 한다면 1-0.1=0.9)일 때의 y값은 0.8이 되겠군요. 2점을 기준으로 2점 이상 받은 사람이 600명 , 2점 미만 받은 사람이 400명이라면 2점을 기준으로 참, 거짓을 나누면 그 퍼센트는 0.6이 될 겁니다. 즉, x=0.8일 때 y=0.6이 되는 거죠.이런 식으로 각각의 x값(기준되는 점수)에 대해서 그 퍼센트를 y축에 나타낸 것이 ROC커브입니다.
지식인 中
'전공관련 > 주워들은 용어정리' 카테고리의 다른 글
메모리 영역 Heap / Stack / Static (1) | 2013.07.09 |
---|---|
Integral Image ( 적분 영상 ) (2) | 2013.06.21 |
Hessian Matrix ( 헤시안 행렬 ) (0) | 2013.06.21 |
AAM (0) | 2013.06.19 |
Annotation (0) | 2013.06.19 |