FEATURE_SET
구문
FEATURE_SET ( [ schema . ] model [, topN [, cutoff ]] mining_attribute_clause )
분석 구문
FEATURE_SET ( INTO n [, topN [, cutoff ] ] mining_attribute_clause )
OVER ( mining_analytic_clause )
참고:
mining_analytic_clause에 대한 구문, 의미, 그리고 제한 사항에 대한 정보는 "Analytic Functions"에 대한 내용을 참조하세요.
목적
FEATURE_SET는 선택한 각 행에 대해 특징 ID와 특징 값 쌍의 집합(set)을 반환합니다. 반환 값은 FEATURE_ID와 VALUE라는 필드 이름을 가진 객체의 varray입니다. 두 필드의 데이터 유형은 모두 NUMBER입니다.
topN and cutoff
함수에 의해 반환되는 특징들의 수를 제한하기 위해 topN과 cutoff을 지정할 수 있습니다. 기본적으로 topN과 cutoff은 모두 null이며 모든 특징이 반환됩니다.
- topN은 N개의 가장 높은 값을 가진 특징들입니다. 여러 특징이 N번째 값을 가지는 경우, 함수는 그 중 하나를 선택합니다.
- cutoff은 값의 임계치입니다. cutoff보다 크거나 같은 특징만이 반환됩니다. cutoff으로만 필터링하려면 topN에 NULL을 지정하십시오.
cutoff 이상의 N개의 특징을 반환하려면, topN과 cutoff을 모두 지정하십시오.
구문 선택
FEATURE_SET 함수는 두 가지 방법으로 데이터에 대한 스코어링을 수행할 수 있습니다. 첫 번째 방법은 데이터에 마이닝 모델 객체를 적용하는 것이고, 두 번째 방법은 분석 절을 실행하여 하나 이상의 일시적인 마이닝 모델을 구축하고 적용하는 것입니다. 구문 또는 분석 구문을 선택하세요:
- 구문 - 미리 정의된 모델로 데이터를 평가하려면 첫 번째 구문을 사용합니다. clustering model의 이름을 지정합니다.
- 분석 구문 - 미리 정의된 모델 없이 데이터를 평가하려면 INTO n과 mining_analytic_clause를 포함하는 분석적인 구문을 사용합니다. 여기서 n은 계산할 cluster 수를 나타내며, mining_analytic_clause는 데이터를 여러 모델 작성을 위해 분할할지 여부를 지정합니다. mining_analytic_clause는 query_partition_clause와 order_by_clause를 지원합니다. (analytic_clause::= 참조)
FEATURE_SET 함수의 구문은 분할된 모델을 평가할 때 선택적으로 GROUPING 힌트를 사용할 수 있습니다. GROUPING Hint 참조.
mining_attribute_clause
mining_attribute_clause는 스코어링을 위해 예측 변수로 사용할 열 속성들을 식별합니다. 함수가 분석 구문으로 호출될 때, 이러한 predictors는 임시 모델을 작성하는 데에도 사용됩니다. mining_attribute_clause는 PREDICTION 함수와 동일하게 동작합니다. (mining_attribute_clause::= 참조)
참고:
- scoring에 대한 자세한 정보는 Oracle Data Mining User’s Guide를 참조하세요.
- 특징 추출(feature extraction)에 대한 정보는 Oracle Data Mining Concepts를 참조하세요.
노트: 다음 예제들은 데이터 마이닝 샘플 프로그램에서 발췌한 것입니다. 샘플 프로그램에 대한 자세한 정보는 Oracle Data Mining User’s Guide의 부록 A를 참조하세요.
예제
이 예제는 주어진 고객 레코드에 해당하는 최상위 특징들을 나열하고 (계수 > 0.25 기준) 각 특징에 대한 최상위 속성들을 결정합니다.
WITH
feat_tab AS (
SELECT F.feature_id fid,
A.attribute_name attr,
TO_CHAR(A.attribute_value) val,
A.coefficient coeff
FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_NMF('nmf_sh_sample')) F,
TABLE(F.attribute_set) A
WHERE A.coefficient > 0.25
),
feat AS (
SELECT fid,
CAST(COLLECT(Featattr(attr, val, coeff))
AS Featattrs) f_attrs
FROM feat_tab
GROUP BY fid
),
cust_10_features AS (
SELECT T.cust_id, S.feature_id, S.value
FROM (SELECT cust_id, FEATURE_SET(nmf_sh_sample, 10 USING *) pset
FROM nmf_sh_sample_apply_prepared
WHERE cust_id = 100002) T,
TABLE(T.pset) S
)
SELECT A.value, A.feature_id fid,
B.attr, B.val, B.coeff
FROM cust_10_features A,
(SELECT T.fid, F.*
FROM feat T,
TABLE(T.f_attrs) F) B
WHERE A.feature_id = B.fid
ORDER BY A.value DESC, A.feature_id ASC, coeff DESC, attr ASC, val ASC;
VALUE FID ATTR VAL COEFF
-------- ---- ------------------------- ------------------------ -------
6.8409 7 YRS_RESIDENCE 1.3879
6.8409 7 BOOKKEEPING_APPLICATION .4388
6.8409 7 CUST_GENDER M .2956
6.8409 7 COUNTRY_NAME United States of America .2848
6.4975 3 YRS_RESIDENCE 1.2668
6.4975 3 BOOKKEEPING_APPLICATION .3465
6.4975 3 COUNTRY_NAME United States of America .2927
6.4886 2 YRS_RESIDENCE 1.3285
6.4886 2 CUST_GENDER M .2819
6.4886 2 PRINTER_SUPPLIES .2704
6.3953 4 YRS_RESIDENCE 1.2931
5.9640 6 YRS_RESIDENCE 1.1585
5.9640 6 HOME_THEATER_PACKAGE .2576
5.2424 5 YRS_RESIDENCE 1.0067
2.4714 8 YRS_RESIDENCE .3297
2.3559 1 YRS_RESIDENCE .2768
2.3559 1 FLAT_PANEL_MONITOR .2593
출처: 오라클 레퍼런스
원문 링크: Oracle FEATURE_SET 함수 문서
'코딩 > 오라클 함수' 카테고리의 다른 글
[오라클 레퍼런스 함수] FIRST - 그룹 내 첫 번째 값 반환 (0) | 2023.08.05 |
---|---|
[오라클 레퍼런스 함수] FEATURE_VALUE - 특징 값 반환 (0) | 2023.08.05 |
[오라클 레퍼런스 함수] FEATURE_ID - 최고 값 특성의 식별자 반환 (0) | 2023.08.05 |
[오라클 레퍼런스 함수] FEATURE_DETAILS - 데이터 마이닝 특성 세부 정보 반환 (0) | 2023.08.05 |
[오라클 레퍼런스 함수] FEATURE_COMPARE - 문서 유사성 또는 비유사성 비교 (0) | 2023.08.05 |
댓글