본문 바로가기

[오라클 레퍼런스 함수] STATS_ONE_WAY_ANOVA - 두 그룹의 분산 추정치 비교

by ㅇㅍㅍ 2023. 8. 20.
[오라클 레퍼런스 함수] STATS_ONE_WAY_ANOVA - 두 그룹의 분산 추정치 비교
728x90

 

 

 

STATS_ONE_WAY_ANOVA

 

구문

STATS_ONE_WAY_ANOVA(expr1, expr2
                    [, { SUM_SQUARES_BETWEEN
                       | SUM_SQUARES_WITHIN
                       | DF_BETWEEN
                       | DF_WITHIN
                       | MEAN_SQUARES_BETWEEN
                       | MEAN_SQUARES_WITHIN
                       | F_RATIO
                       | SIG
                       }
                    ]
                   )

 

목적

단일 요인 분산 분석 함수인 STATS_ONE_WAY_ANOVA는 통계적으로 유의미한 차이를 확인하기 위해 그룹 또는 변수의 평균(means) 간의 차이를 테스트합니다. 이를 위해 두 가지 다른 분산 추정치를 비교합니다. 하나는 각 그룹 또는 범주(category) 내의 분산을 기반으로 한 추정치로, 이것을 그룹 내 평균 제곱(mean squares within) 또는 오차 평균 제곱(mean square error)이라고 합니다. 다른 하나는 그룹 평균 간의 분산을 기반으로 한 추정치로, 이것을 그룹 간 평균 제곱(mean squares between)이라고 합니다. 그룹의 평균이 유의미하게 다르다면 그룹 간 평균 제곱이 예상보다 크고 그룹 내 평균 제곱과 일치하지 않을 것입니다. 그룹의 평균이 일관되면 두 분산 추정치는 비슷할 것입니다.

STATS_ONE_WAY_ANOVA 함수는 두 개의 필수 인수를 사용합니다. expr1은 데이터를 여러 그룹으로 분류하는 독립 또는 그룹화 변수이며, expr2는 각 그룹의 구성원에 해당하는 값을 포함하는 종속 변수(숫자 표현식)입니다. 선택적으로 제공할 수 있는(optional) 세 번째 인수를 사용하면 이 함수가 반환하는 NUMBER 값의 의미를 지정할 수 있습니다. 이것은 표 7-8에 표시된 대로 의미를 지정합니다. 이 인수에는 텍스트 리터럴을 지정하거나 상수 문자 값으로 평가되는 바인드 변수나 표현식을 사용할 수 있습니다. 세 번째 인수를 생략하면 기본값은 'SIG'입니다.

 

참고:

Oracle Database Globalization Support Guide의 부록 C는 STATS_ONE_WAY_ANOVA 함수의 정렬 결정 규칙(collation determination rules)에 대한 정보를 제공합니다.

 

표 7-8 STATS_ONE_WAY_ANOVA 반환 값

인수 반환 값 의미
'SUM_SQUARES_BETWEEN' 그룹 간 합 제곱
'SUM_SQUARES_WITHIN' 그룹 내 합 제곱
'DF_BETWEEN' 그룹 간 자유도(Degree of freedom)
'DF_WITHIN' 그룹 내 자유도(Degree of freedom)
'MEAN_SQUARES_BETWEEN' 그룹 간 평균 제곱
'MEAN_SQUARES_WITHIN' 그룹 내 평균 제곱
'F_RATIO' 그룹 간 평균 제곱과 그룹 내 평균 제곱의 비율 (MSB/MSW)
'SIG' 유의성

 

일원 분산 분석의 유의성은 그룹 간 평균 제곱과 그룹 내 평균 제곱의 비율에 대한 f-test의 일측 유의성을 획득하여 결정됩니다. 평균 제곱 간은 평균 제곱 내와 같거나 크기 때문에 f-test는 일측 유의성을 사용해야 합니다. 따라서 STATS_ONE_WAY_ANOVA에 의해 반환되는 유의성은 그룹 간의 차이가 우연한 결과로 발생한 확률로, 0과 1 사이의 수입니다. 숫자가 작을수록 그룹 간 차이의 유의성이 큽니다. f-test 수행에 대한 정보는 STATS_F_TEST를 참조하십시오.

 

예제

다음 예제는 소득 수준 내 평균 판매액의 차이와 소득 수준 간 평균 판매액의 차이의 유의성을 결정합니다. 결과인 p 값(p_values)이 거의 0에 가까운 값은 남성과 여성 모두에게 다른 소득 수준 간 판매된 상품의 양에 유의미한 차이가 있다는 것을 나타냅니다.

SELECT cust_gender,
       STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'F_RATIO') f_ratio,
       STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'SIG') p_value
  FROM sh.customers c, sh.sales s
  WHERE c.cust_id = s.cust_id
  GROUP BY cust_gender
  ORDER BY cust_gender;

C    F_RATIO    P_VALUE
- ---------- ----------
F 5.59536943 4.7840E-09
M  9.2865001 6.7139E-17

 


출처: 오라클 레퍼런스

원문 링크: Oracle STATS_ONE_WAY_ANOVA 함수 문서

 

반응형

댓글