본문 바로가기

[오라클 레퍼런스 함수] STATS_KS_TEST - 두 샘플 간의 분포 차이 검정

by ㅇㅍㅍ 2023. 8. 19.
[오라클 레퍼런스 함수] STATS_KS_TEST - 두 샘플 간의 분포 차이 검정
728x90

 

STATS_KS_TEST

 

구문

STATS_KS_TEST(expr1, expr2
              [, { STATISTIC | SIG } ]
             )

 

목적

STATS_KS_TEST는 두 샘플을 비교하여 이들이 같은 모집단에서 가져온 것인지 또는 동일한 분포를 가진 모집단에서 가져온 것인지를 테스트하는 Kolmogorov-Smirnov 함수입니다. 이 함수는 샘플이 추출된 모집단이 정규 분포를 따른다고 가정하지 않습니다.

이 함수는 두 개의 필수 인수를 사용합니다. expr1은 데이터를 두 샘플로 분류하고, expr2는 각 샘플의 값을 포함합니다. expr1이 데이터를 하나의 샘플로만 분류하거나 두 개 이상의 샘플로 분류하는 경우 오류가 발생합니다. 선택적인 세 번째 인수를 사용하면 이 함수가 반환하는 NUMBER 값의 의미를 지정할 수 있습니다. 이것은 표 7-6에 표시된 대로 의미를 지정합니다. 이 인수에는 텍스트 리터럴을 지정하거나 상수 문자 값으로 평가되는 바인드 변수 또는 표현식을 사용할 수 있습니다. 세 번째 인수를 생략하면 기본값은 'SIG'입니다.

 

참고:

Oracle Database Globalization Support Guide의 부록 C는 STATS_KS_TEST의 정렬 결정 규칙(collation determination rules)에 대한 정보를 제공합니다.

 

표 7-6 STATS_KS_TEST 반환 값

인수 반환 값 의미
'STATISTIC' D의 관측값(Observed value)
'SIG' D의 유의성(Significance)

 

STATS_KS_TEST 예제

콜모고로프-스미르노프 검정(Kolmogorov Smirnov test)을 사용하여 다음 예제는 남성과 여성 간의 판매 분포가 우연한 결과인지 여부를 결정합니다:

SELECT stats_ks_test(cust_gender, amount_sold, 'STATISTIC') ks_statistic,
       stats_ks_test(cust_gender, amount_sold) p_value
  FROM sh.customers c, sh.sales s
  WHERE c.cust_id = s.cust_id;

KS_STATISTIC    P_VALUE
------------ ----------
  .003841396 .004080006

 


출처: 오라클 레퍼런스

원문 링크: Oracle STATS_KS_TEST 함수 문서

 

반응형

댓글