본문 바로가기

[오라클 레퍼런스 함수] CLUSTER_PROBABILITY - 클러스터 확률 반환

by ㅇㅍㅍ 2023. 8. 1.
[오라클 레퍼런스 함수] CLUSTER_PROBABILITY - 클러스터 확률 반환
728x90

CLUSTER_PROBABILITY

 

구문

CLUSTER_PROBABILITY ( [ schema . ] model [, cluster_id ] mining_attribute_clause )

 

분석 구문

CLUSTER_PROBABILITY ( INTO n [, cluster_id] mining_attribute_clause )
                    OVER ( mining_analytic_clause )

 

mining_attribute_clause::=
USING
{ * 
| { [ schema . ] table . * 
  | expr [ AS alias ]
  }
    [, { [ schema . ] table . * 
       | expr [ AS alias ]
       }
    ]...
}

mining_analytic_clause::=
[ query_partition_clause ] [ order_by_clause ]

 

참고:

mining_analytic_clause의 구문, 의미 및 제약 사항에 대한 정보는 Analytic Functions를 참조하시기 바랍니다.

 

목적

CLUSTER_PROBABILITY는 선택된 각 행에 대해 확률을 반환합니다. 이 확률은 가장 높은 확률 클러스터 또는 지정된 cluster_id에 대한 확률을 나타냅니다. 클러스터 확률은 BINARY_DOUBLE 형식으로 반환됩니다.

 

구문 선택

CLUSTER_PROBABILITY 함수는 두 가지 방법으로 데이터에 대한 스코어링을 수행할 수 있습니다. 첫 번째 방법은 데이터에 마이닝 모델 객체를 적용하는 것이고, 두 번째 방법은 분석 절을 실행하여 하나 이상의 일시적인 마이닝 모델을 구축하고 적용하는 것입니다. 구문 또는 분석 구문을 선택하세요:

 

  • 구문 - 미리 정의된 모델로 데이터를 평가하려면 첫 번째 구문을 사용합니다. clustering model의 이름을 지정합니다.
  • 분석 구문 - 미리 정의된 모델 없이 데이터를 평가하려면 INTO n과 mining_analytic_clause를 포함하는 분석적인 구문을 사용합니다. 여기서 n은 계산할 cluster 수를 나타내며, mining_analytic_clause는 데이터를 여러 모델 작성을 위해 분할할지 여부를 지정합니다. mining_analytic_clausequery_partition_clauseorder_by_clause를 지원합니다. (analytic_clause::= 참조)

 

CLUSTER_PROBABILITY 함수의 구문은 분할된 모델을 평가할 때 선택적으로 GROUPING 힌트를 사용할 수 있습니다. GROUPING Hint 참조.

 

mining_attribute_clause

mining_attribute_clause는 스코어링을 위해 예측 변수로 사용할 열 속성들을 식별합니다. 함수가 분석 구문으로 호출될 때, 이러한 predictors는 임시 모델을 작성하는 데에도 사용됩니다. mining_attribute_clausePREDICTION 함수와 동일하게 동작합니다. (mining_attribute_clause::= 참조)

 

참고:

 

노트: 다음 예제들은 데이터 마이닝 샘플 프로그램에서 발췌한 것입니다. 샘플 프로그램에 대한 자세한 정보는 Oracle Data Mining User’s Guide의 부록 A를 참조하세요.

 

예제

다음 예제는 클러스터 2의 가능성에 따라 가장 대표적인 10명의 고객을 나열합니다.

SELECT cust_id
  FROM (SELECT cust_id, rank() OVER (ORDER BY prob DESC, cust_id) rnk_clus2
    FROM (SELECT cust_id, CLUSTER_PROBABILITY(km_sh_clus_sample, 2 USING *) prob
          FROM mining_data_apply_v))
WHERE rnk_clus2 <= 10
ORDER BY rnk_clus2;
 
   CUST_ID
----------
    100256
    100988
    100889
    101086
    101215
    100390
    100985
    101026
    100601
    100672

 


출처: 오라클 레퍼런스

원문 링크: Oracle CLUSTER_PROBABILITY 함수 문서

 

반응형

댓글