자료의 형태, 명목변수, 순위변수, 연속변수(간격척도, 비척도)...펌
2010/07/22 10:41
http://blog.naver.com/medirun/90091966664
자료의형태
질적변수
또는
비연속변수 |
명목척도 (nominal scale) |
- 측정된현상을상호배타적범주로구분., 성별, 혈액형 : 수학적연산불가능. 각범주들사이크기또는순위개념없음 - 이분변수(binary data)와다항변수(polynomial data) - 최빈값(mode), 각범주의도수와분율 |
순위척도 (ordinal scale) |
- 측정된현상을상호배타적범주로구분. 병기, 점수체계 : 수학적연산불가능. 각범주들사이크기또는서열개념있음 - 암의병기나다양한점수체계(grading system) - 최빈값(mode) 또는중앙값(median), 각범주의도수와분율 | |
양적변수
또는
연속변수 |
간격척도 |
- 연속변수지만절대0점이정의되어있지않은변수. 온도 : 숫자로표기되어사칙연산중덧셈/뺄셈가능, 곱셈/나눗셈불가능 - 순위척도는변수들간서열은있으나간격은동일하다볼수없음 - 평균(mean) 또는중앙값(median), 범위(range) 또는사분범위(IQR) |
비척도 |
- 사칙연산이모두가능한연속변수로절대0점이있음. 나이, 체중, 신장 - 순위척도는변수들간서열은있으나간격은동일하다볼수없음 - 평균(mean) 또는중앙값(median), 범위(range) 또는사분범위(IQR) |
“평균±표준편차”와 관련된 오류
1. 순위변수에 사용할 수 없다.
예) 환자군의 평균 병기가1.7기였다.
→ 2기가 가장 많았고50%를 차지했다.
2. 연속변수라 하더라도 자료값이 심한 쏠림(skewness)을 보이는 경우에는
평균보다 큰 표준편차가 발생하기 때문에 정규분포에 사용하는 것이 적절하다.
만약, 정규분포를 이루지 않은 자료값들에서는
대표값과 산포도로 중앙값과 범위를 제시하는 것이 바람직하다