본문 바로가기

[오라클 레퍼런스 함수] CLUSTER_DISTANCE - 클러스터 거리 반환

by ㅇㅍㅍ 2023. 8. 1.
[오라클 레퍼런스 함수] CLUSTER_DISTANCE - 클러스터 거리 반환
728x90

CLUSTER_DISTANCE

 

구문

CLUSTER_DISTANCE ( [ schema . ] model [ , cluster_id ] mining_attribute_clause )

 

분석 구문

CLUSTER_DISTANCE ( INTO n [, cluster_id] mining_attribute_clause )
                 OVER ( mining_analytic_clause )

 

mining_attribute_clause::=
USING
{ * 
| { [ schema . ] table . * 
  | expr [ AS alias ]
  }
    [, { [ schema . ] table . * 
       | expr [ AS alias ]
       }
    ]...
}

mining_analytic_clause::=
[ query_partition_clause ] [ order_by_clause ]

 

참고:

mining_analytic_clause의 구문, 의미 및 제약 사항에 대한 정보는 Analytic Functions를 참조하시기 바랍니다.

 

목적

CLUSTER_DISTANCE 함수는 선택된 각 행에 대해 클러스터 거리를 반환합니다. 클러스터 거리는 해당 행과 가장 높은 확률의 클러스터 또는 지정된 cluster_id의 중심점과의 거리를 의미합니다. 이 거리는 BINARY_DOUBLE 형식으로 반환됩니다.

 

구문 선택

CLUSTER_DISTANCE 함수는 두 가지 방법으로 데이터에 대한 스코어링을 수행할 수 있습니다. 첫 번째 방법은 데이터에 마이닝 모델 객체를 적용하는 것이고, 두 번째 방법은 분석 절을 실행하여 하나 이상의 일시적인 마이닝 모델을 구축하고 적용하는 것입니다. 구문 또는 분석 구문을 선택하세요:

 

  • 구문 - 미리 정의된 모델로 데이터를 평가하려면 첫 번째 구문을 사용합니다. clustering model의 이름을 지정합니다.
  • 분석 구문 - 미리 정의된 모델 없이 데이터를 평가하려면 INTO n과 mining_analytic_clause를 포함하는 분석적인 구문을 사용합니다. 여기서 n은 계산할 cluster 수를 나타내며, mining_analytic_clause는 데이터를 여러 모델 작성을 위해 분할할지 여부를 지정합니다. mining_analytic_clausequery_partition_clauseorder_by_clause를 지원합니다. (analytic_clause::= 참조)

 

CLUSTER_DISTANCE 함수의 구문은 분할된 모델을 평가할 때 선택적으로 GROUPING 힌트를 사용할 수 있습니다. GROUPING Hint 참조.

 

mining_attribute_clause

mining_attribute_clause는 스코어링을 위해 예측 변수로 사용할 열 속성들을 식별합니다. 함수가 분석 구문으로 호출될 때, 이러한 predictors는 임시 모델을 작성하는 데에도 사용됩니다. mining_attribute_clausePREDICTION 함수와 동일하게 동작합니다. (mining_attribute_clause::= 참조)

 

참고:

 

노트: 다음 예제들은 데이터 마이닝 샘플 프로그램에서 발췌한 것입니다. 샘플 프로그램에 대한 자세한 정보는 Oracle Data Mining User’s Guide의 부록 A를 참조하세요.

 

예제

이 예제는 각 행의 클러스터 중심점으로부터의 거리에 의해 가장 이상적인 10개의 행을 찾습니다. 즉, 이 예제는 클러스터 중심점과 가장 멀리 떨어져 있는 행들을 찾아냅니다.

SELECT cust_id
  FROM (
    SELECT cust_id,
           rank() over
             (order by CLUSTER_DISTANCE(km_sh_clus_sample USING *) desc) rnk
      FROM mining_data_apply_v)
  WHERE rnk <= 11
  ORDER BY rnk;
 
   CUST_ID
----------
    100579
    100050
    100329
    100962
    101251
    100179
    100382
    100713
    100629
    100787
    101478

 


출처: 오라클 레퍼런스

원문 링크: Oracle CLUSTER_DISTANCE 함수 문서

 

반응형

댓글