CLUSTER_DISTANCE
구문
CLUSTER_DISTANCE ( [ schema . ] model [ , cluster_id ] mining_attribute_clause )
분석 구문
CLUSTER_DISTANCE ( INTO n [, cluster_id] mining_attribute_clause )
OVER ( mining_analytic_clause )
mining_attribute_clause::=
USING
{ *
| { [ schema . ] table . *
| expr [ AS alias ]
}
[, { [ schema . ] table . *
| expr [ AS alias ]
}
]...
}
mining_analytic_clause::=
[ query_partition_clause ] [ order_by_clause ]
참고:
mining_analytic_clause의 구문, 의미 및 제약 사항에 대한 정보는 Analytic Functions를 참조하시기 바랍니다.
목적
CLUSTER_DISTANCE 함수는 선택된 각 행에 대해 클러스터 거리를 반환합니다. 클러스터 거리는 해당 행과 가장 높은 확률의 클러스터 또는 지정된 cluster_id의 중심점과의 거리를 의미합니다. 이 거리는 BINARY_DOUBLE 형식으로 반환됩니다.
구문 선택
CLUSTER_DISTANCE 함수는 두 가지 방법으로 데이터에 대한 스코어링을 수행할 수 있습니다. 첫 번째 방법은 데이터에 마이닝 모델 객체를 적용하는 것이고, 두 번째 방법은 분석 절을 실행하여 하나 이상의 일시적인 마이닝 모델을 구축하고 적용하는 것입니다. 구문 또는 분석 구문을 선택하세요:
- 구문 - 미리 정의된 모델로 데이터를 평가하려면 첫 번째 구문을 사용합니다. clustering model의 이름을 지정합니다.
- 분석 구문 - 미리 정의된 모델 없이 데이터를 평가하려면 INTO n과 mining_analytic_clause를 포함하는 분석적인 구문을 사용합니다. 여기서 n은 계산할 cluster 수를 나타내며, mining_analytic_clause는 데이터를 여러 모델 작성을 위해 분할할지 여부를 지정합니다. mining_analytic_clause는 query_partition_clause와 order_by_clause를 지원합니다. (analytic_clause::= 참조)
CLUSTER_DISTANCE 함수의 구문은 분할된 모델을 평가할 때 선택적으로 GROUPING 힌트를 사용할 수 있습니다. GROUPING Hint 참조.
mining_attribute_clause
mining_attribute_clause는 스코어링을 위해 예측 변수로 사용할 열 속성들을 식별합니다. 함수가 분석 구문으로 호출될 때, 이러한 predictors는 임시 모델을 작성하는 데에도 사용됩니다. mining_attribute_clause는 PREDICTION 함수와 동일하게 동작합니다. (mining_attribute_clause::= 참조)
참고:
- scoring에 대한 자세한 정보는 Oracle Data Mining User’s Guide를 참조하세요.
- clustering에 대한 정보는 Oracle Data Mining Concepts를 참조하세요.
노트: 다음 예제들은 데이터 마이닝 샘플 프로그램에서 발췌한 것입니다. 샘플 프로그램에 대한 자세한 정보는 Oracle Data Mining User’s Guide의 부록 A를 참조하세요.
예제
이 예제는 각 행의 클러스터 중심점으로부터의 거리에 의해 가장 이상적인 10개의 행을 찾습니다. 즉, 이 예제는 클러스터 중심점과 가장 멀리 떨어져 있는 행들을 찾아냅니다.
SELECT cust_id
FROM (
SELECT cust_id,
rank() over
(order by CLUSTER_DISTANCE(km_sh_clus_sample USING *) desc) rnk
FROM mining_data_apply_v)
WHERE rnk <= 11
ORDER BY rnk;
CUST_ID
----------
100579
100050
100329
100962
101251
100179
100382
100713
100629
100787
101478
출처: 오라클 레퍼런스
원문 링크: Oracle CLUSTER_DISTANCE 함수 문서
'코딩 > 오라클 함수' 카테고리의 다른 글
[오라클 레퍼런스 함수] CLUSTER_PROBABILITY - 클러스터 확률 반환 (0) | 2023.08.01 |
---|---|
[오라클 레퍼런스 함수] CLUSTER_ID - 클러스터 식별자 반환 (0) | 2023.08.01 |
[오라클 레퍼런스 함수] CLUSTER_DETAILS - 클러스터 세부 정보를 반환 (0) | 2023.08.01 |
[오라클 레퍼런스 함수] CHR - 캐릭터셋의 숫자 값을 문자로 변환 (0) | 2023.08.01 |
[오라클 레퍼런스 함수] CHARTOROWID - 문자열을 실제 ROWID로 변환 (0) | 2023.07.31 |
댓글