본문 바로가기

[오라클 레퍼런스 함수] STATS_MW_TEST - 두 모집단 비교 통계 검정(test)

by ㅇㅍㅍ 2023. 8. 20.
[오라클 레퍼런스 함수] STATS_MW_TEST - 두 모집단 비교 통계 검정(test)
728x90

 

STATS_MW_TEST

 

구문

STATS_MW_TEST(expr1, expr2
              [, { STATISTIC
                 | U_STATISTIC
                 | ONE_SIDED_SIG , expr3
                 | TWO_SIDED_SIG
                 }
              ]
             )

 

목적

맨 휘트니 검정(Mann Whitney test)은 두 독립 샘플을 비교하여 두 모집단이 동일한 분포 함수를 가지는 귀무 가설(null hypothesis)을 대립 가설(alternative hypothesis)과 비교하여 테스트하는 통계 검정 방법입니다.

STATS_MW_TEST 함수는 샘플 간의 차이가 정규 분포를 따른다고 가정하지 않고, STATS_T_TEST_* 함수와는 달리 이를 사용합니다. 이 함수는 두 개의 필수 인수를 사용합니다. expr1은 데이터를 그룹으로 분류하고, expr2는 각 그룹의 값을 포함합니다. 선택적으로 제공할 수 있는(optional) 세 번째 인수를 사용하면 이 함수가 반환하는 NUMBER 값의 의미를 지정할 수 있습니다. 이것은 표 7-7에 표시된 대로 의미를 지정합니다. 이 인수에는 텍스트 리터럴을 지정하거나 상수 문자 값으로 평가되는 바인드 변수나 표현식을 사용할 수 있습니다. 세 번째 인수를 생략하면 기본값은 'TWO_SIDED_SIG'입니다.

 

참고:

Oracle Database Globalization Support Guide의 부록 C는 STATS_MW_TEST 함수의 정렬 결정 규칙(collation determination rules)에 대한 정보를 제공합니다.

 

표 7-7 STATS_MW_TEST 반환 값

인수 반환 값 의미
'STATISTIC' Z의 관측값
'U_STATISTIC' U의 관측값
'ONE_SIDED_SIG' Z의 단측 유의성
'TWO_SIDED_SIG' Z의 양측 유의성

Z 또는 U의 관측값의 유의성은 분산이 우연한 결과로 다르다는 확률을 나타냅니다. 이 값은 0과 1 사이의 수입니다. 유의성 값이 작으면 분산이 유의미하게 다르다는 것을 나타냅니다. 각 분산의 자유도는 샘플 내 관측값 수에서 1을 뺀 값입니다.

단측 유의성은 항상 상단 꼬리에 관련이 있습니다. 마지막 인수 expr3은 expr1에 의해 지정된 두 그룹 중 어느 그룹이 높은 값을 나타내는지를 나타냅니다 (상단 꼬리의 거부 영역에 해당하는 값).

STATS_MW_TEST는 값의 순위 합의 차이를 확인하여 샘플이 동일한 분포에서 나왔을 확률을 계산합니다. 샘플이 동일한 분포에서 나왔다면 합계는 값에 가까워야 합니다.

 

STATS_MW_TEST 예제

만 휘트니 검정(Mann Whitney test)을 사용하여, 다음 예제는 남성과 여성 간의 판매 분포가 우연한 결과인지를 결정합니다:

SELECT STATS_MW_TEST
         (cust_gender, amount_sold, 'STATISTIC') z_statistic,
       STATS_MW_TEST
         (cust_gender, amount_sold, 'ONE_SIDED_SIG', 'F') one_sided_p_value
  FROM sh.customers c, sh.sales s
  WHERE c.cust_id = s.cust_id;

Z_STATISTIC ONE_SIDED_P_VALUE
----------- -----------------
 -1.4011509        .080584471

 


출처: 오라클 레퍼런스

원문 링크: Oracle STATS_MW_TEST 함수 문서

 

반응형

댓글