STATS_ONE_WAY_ANOVA
구문
STATS_ONE_WAY_ANOVA(expr1, expr2
[, { SUM_SQUARES_BETWEEN
| SUM_SQUARES_WITHIN
| DF_BETWEEN
| DF_WITHIN
| MEAN_SQUARES_BETWEEN
| MEAN_SQUARES_WITHIN
| F_RATIO
| SIG
}
]
)
목적
단일 요인 분산 분석 함수인 STATS_ONE_WAY_ANOVA는 통계적으로 유의미한 차이를 확인하기 위해 그룹 또는 변수의 평균(means) 간의 차이를 테스트합니다. 이를 위해 두 가지 다른 분산 추정치를 비교합니다. 하나는 각 그룹 또는 범주(category) 내의 분산을 기반으로 한 추정치로, 이것을 그룹 내 평균 제곱(mean squares within) 또는 오차 평균 제곱(mean square error)이라고 합니다. 다른 하나는 그룹 평균 간의 분산을 기반으로 한 추정치로, 이것을 그룹 간 평균 제곱(mean squares between)이라고 합니다. 그룹의 평균이 유의미하게 다르다면 그룹 간 평균 제곱이 예상보다 크고 그룹 내 평균 제곱과 일치하지 않을 것입니다. 그룹의 평균이 일관되면 두 분산 추정치는 비슷할 것입니다.
STATS_ONE_WAY_ANOVA 함수는 두 개의 필수 인수를 사용합니다. expr1은 데이터를 여러 그룹으로 분류하는 독립 또는 그룹화 변수이며, expr2는 각 그룹의 구성원에 해당하는 값을 포함하는 종속 변수(숫자 표현식)입니다. 선택적으로 제공할 수 있는(optional) 세 번째 인수를 사용하면 이 함수가 반환하는 NUMBER 값의 의미를 지정할 수 있습니다. 이것은 표 7-8에 표시된 대로 의미를 지정합니다. 이 인수에는 텍스트 리터럴을 지정하거나 상수 문자 값으로 평가되는 바인드 변수나 표현식을 사용할 수 있습니다. 세 번째 인수를 생략하면 기본값은 'SIG'입니다.
참고:
Oracle Database Globalization Support Guide의 부록 C는 STATS_ONE_WAY_ANOVA 함수의 정렬 결정 규칙(collation determination rules)에 대한 정보를 제공합니다.
표 7-8 STATS_ONE_WAY_ANOVA 반환 값
인수 | 반환 값 의미 |
'SUM_SQUARES_BETWEEN' | 그룹 간 합 제곱 |
'SUM_SQUARES_WITHIN' | 그룹 내 합 제곱 |
'DF_BETWEEN' | 그룹 간 자유도(Degree of freedom) |
'DF_WITHIN' | 그룹 내 자유도(Degree of freedom) |
'MEAN_SQUARES_BETWEEN' | 그룹 간 평균 제곱 |
'MEAN_SQUARES_WITHIN' | 그룹 내 평균 제곱 |
'F_RATIO' | 그룹 간 평균 제곱과 그룹 내 평균 제곱의 비율 (MSB/MSW) |
'SIG' | 유의성 |
일원 분산 분석의 유의성은 그룹 간 평균 제곱과 그룹 내 평균 제곱의 비율에 대한 f-test의 일측 유의성을 획득하여 결정됩니다. 평균 제곱 간은 평균 제곱 내와 같거나 크기 때문에 f-test는 일측 유의성을 사용해야 합니다. 따라서 STATS_ONE_WAY_ANOVA에 의해 반환되는 유의성은 그룹 간의 차이가 우연한 결과로 발생한 확률로, 0과 1 사이의 수입니다. 숫자가 작을수록 그룹 간 차이의 유의성이 큽니다. f-test 수행에 대한 정보는 STATS_F_TEST를 참조하십시오.
예제
다음 예제는 소득 수준 내 평균 판매액의 차이와 소득 수준 간 평균 판매액의 차이의 유의성을 결정합니다. 결과인 p 값(p_values)이 거의 0에 가까운 값은 남성과 여성 모두에게 다른 소득 수준 간 판매된 상품의 양에 유의미한 차이가 있다는 것을 나타냅니다.
SELECT cust_gender,
STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'F_RATIO') f_ratio,
STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'SIG') p_value
FROM sh.customers c, sh.sales s
WHERE c.cust_id = s.cust_id
GROUP BY cust_gender
ORDER BY cust_gender;
C F_RATIO P_VALUE
- ---------- ----------
F 5.59536943 4.7840E-09
M 9.2865001 6.7139E-17
출처: 오라클 레퍼런스
원문 링크: Oracle STATS_ONE_WAY_ANOVA 함수 문서
'코딩 > 오라클 함수' 카테고리의 다른 글
[오라클 레퍼런스 함수] STATS_WSR_TEST - 짝지은 샘플의 중앙값 차이 유의성 검정(test) (0) | 2023.08.21 |
---|---|
[오라클 레퍼런스 함수] STATS_T_TEST_* - 두 그룹의 평균 차이 검정(test) (0) | 2023.08.20 |
[오라클 레퍼런스 함수] STATS_MW_TEST - 두 모집단 비교 통계 검정(test) (0) | 2023.08.20 |
[오라클 레퍼런스 함수] STATS_MODE - 최빈값(가장 높은 빈도수) 값 반환 (0) | 2023.08.20 |
[오라클 레퍼런스 함수] STATS_KS_TEST - 두 샘플 간의 분포 차이 검정 (0) | 2023.08.19 |
댓글