본문 바로가기

[오라클 레퍼런스 함수] PREDICTION_DETAILS - 예측 세부 정보 추출

by ㅇㅍㅍ 2023. 8. 14.
[오라클 레퍼런스 함수] PREDICTION_DETAILS - 예측 세부 정보 추출
728x90

 

 

 

PREDICTION_DETAILS

 

구문

PREDICTION_DETAILS ( [ schema . ] model 
                     [ , class_value [ , topN ] ] [ DESC | ASC | ABS ]
                     mining_attribute_clause )

 

분석 구문

PREDICTION_DETAILS ( ( OF ANOMALY | FOR expr ) [ , class_value [ , topN ] ]
                     [ DESC | ASC | ABS ] mining_attribute_clause )
                   OVER ( mining_analytic_clause )

 

mining_attribute_clause::=

USING
{ * 
| { [ schema . ] table . * 
  | expr [ AS alias ]
  }
    [, { [ schema . ] table . * 
       | expr [ AS alias ]
       }
    ]...
}

 

mining_analytic_clause::=

[ query_partition_clause ] [ order_by_clause ]

 

참고:

mining_analytic_clause에 대한 구문, 의미, 그리고 제한 사항에 대한 정보는 Analytic Functions에 대한 내용을 참조하세요.

 

목적

PREDICTION_DETAILS 함수는 선택된 각 행에 대한 예측 세부 정보(prediction details)를 반환합니다. 반환 값은 예측의 속성을 설명하는 XML 문자열입니다.

회귀(regression)에 대해서는 반환된 세부 정보가 예측된 대상값을 나타냅니다. 분류(classification)와 이상 감지(anomaly detection)에 대해서는 반환된 세부 정보가 가장 높은 확률 클래스 또는 지정된 class_value를 나타냅니다.

 

topN

만약 topN에 대한 값을 지정하면, 함수는 해당 특성 값에 가장 큰 영향을 미치는 N개의 속성을 반환합니다. topN에 대한 값을 지정하지 않으면, 함수는 영향력이 가장 큰 5개의 속성을 반환합니다.

 

DESC, ASC, 또는 ABS

반환된 속성은 가중치에 따라 정렬됩니다. 속성의 가중치는 예측에 대한 긍정적 또는 부정적인 영향을 나타냅니다. 회귀(regression)에서는 긍정적인 가중치가 더 높은 값을 예측하고, 부정적인 가중치는 더 낮은 값을 예측합니다. 분류(classification)와 이상 감지(anomaly detection)에서는 긍정적인 가중치는 더 높은 확률의 예측을 나타내며, 부정적인 가중치는 더 낮은 확률의 예측을 나타냅니다.

기본적으로 PREDICTION_DETAILS는 가장 높은 긍정 가중치를 가진 속성을 반환합니다 (DESC). ASC를 지정하면 가장 높은 부정 가중치를 가진 속성이 반환됩니다. ABS를 지정하면 가장 큰 가중치, 부정적인지 긍정적인지에 상관없이 가장 높은 가중치가 반환됩니다. 결과는 절댓값에 따라 가장 높은 값부터 가장 낮은 값까지 순서대로 정렬됩니다. 가중치가 0인 속성은 결과에 포함되지 않습니다.

 

구문 선택

PREDICTION_DETAILS 함수는 두 가지 방법으로 데이터에 대한 스코어링을 수행할 수 있습니다. 첫 번째 방법은 데이터에 마이닝 모델 객체를 적용하는 것이고, 두 번째 방법은 분석 절을 실행하여 하나 이상의 일시적인 마이닝 모델을 구축하고 적용하는 것입니다. 구문 또는 분석 구문을 선택하세요:

 

  • 구문 - 사전 정의된 모델로 데이터를 평가하려면 첫 번째 구문을 사용합니다. 분류, 회귀 또는 이상 감지를 수행하는 모델의 이름을 제공하십시오.
  • 분석 구문 - 사전 정의된 모델 없이 데이터를 스코어링하는 데 분석 구문을 사용합니다. 분석 구문은 mining_analytic_clause를 사용하며, 데이터가 여러 모델 빌드를 위해 파티션화되어야 하는지 여부를 지정합니다. mining_analytic_clause는 query_partition_clause와 order_by_clause를 지원합니다. (analytic_clause::= 참조)
    º 분류의 경우 FOR expr을 지정하여 expr이 문자 데이터 유형을 갖는 대상 열을 식별하는 식을 지정합니다.
    º 회귀의 경우 FOR expr을 지정하여 expr이 숫자 데이터 유형을 갖는 대상 열을 식별하는 식을 지정합니다.
    º 이상 감지의 경우 키워드 OF ANOMALY를 지정합니다.

PREDICTION_DETAILS 함수의 구문은 분석된 모델에 대한 스코어링 시 선택적으로 GROUPING 힌트를 사용할 수 있습니다. GROUPING 힌트 참조.

 

mining_attribute_clause

mining_attribute_clause는 스코어링을 위해 예측 변수(predictors)로 사용할 열 속성들을 식별합니다. 함수가 분석 구문으로 호출될 때, 이러한 predictors는 임시 모델을 작성하는 데에도 사용됩니다. mining_attribute_clausePREDICTION 함수와 동일하게 동작합니다. (mining_attribute_clause::= 참조)

 

참고:

 

노트: 다음 예제들은 데이터 마이닝 샘플 프로그램에서 발췌한 것입니다. 샘플 프로그램에 대한 자세한 정보는 Oracle Data Mining User’s Guide의 부록 A를 참조하세요.

 

예제

이 예제는 모델 svmr_sh_regr_sample을 사용하여 데이터를 스코어링하는 방법을 보여줍니다. 이 쿼리는 고객의 나이가 높은 값을 예측하는 데 가장 큰 영향을 미치는 세 가지 속성을 반환합니다.

SELECT PREDICTION_DETAILS(svmr_sh_regr_sample, null, 3 USING *) prediction_details
    FROM mining_data_apply_v
    WHERE cust_id = 100001;
 
PREDICTION_DETAILS
---------------------------------------------------------------------------------------
<Details algorithm="Support Vector Machines">
<Attribute name="CUST_MARITAL_STATUS" actualValue="Widowed" weight=".361" rank="1"/>
<Attribute name="CUST_GENDER" actualValue="F" weight=".14" rank="2"/>
<Attribute name="HOME_THEATER_PACKAGE" actualValue="1" weight=".135" rank="3"/>
</Details>

 

분석 구문

이 예제는 데이터에 일반적이지 않은 나이를 가진 고객을 동적으로 식별합니다. 이 쿼리는 일반적인 나이를 예측하거나 예측에서 벗어나는 속성을 반환합니다.

SELECT cust_id, age, pred_age, age-pred_age age_diff, pred_det
    FROM (SELECT cust_id, age, pred_age, pred_det,
          RANK() OVER (ORDER BY ABS(age-pred_age) DESC) rnk
          FROM (SELECT cust_id, age,
             PREDICTION(FOR age USING *) OVER () pred_age,
             PREDICTION_DETAILS(FOR age ABS USING *) OVER () pred_det
             FROM mining_data_apply_v))
    WHERE rnk <= 5;
 
CUST_ID AGE PRED_AGE AGE_DIFF  PRED_DET
------- --- -------- -------- ------------------------------------------------------------------
 100910  80    40.67    39.33 <Details algorithm="Support Vector Machines">
                              <Attribute name="HOME_THEATER_PACKAGE" actualValue="1" weight=".059"
                               rank="1"/>
                              <Attribute name="Y_BOX_GAMES" actualValue="0" weight=".059"
                               rank="2"/>
                              <Attribute name="AFFINITY_CARD" actualValue="0" weight=".059"
                               rank="3"/>
                              <Attribute name="FLAT_PANEL_MONITOR" actualValue="1" weight=".059"
                               rank="4"/>
                              <Attribute name="YRS_RESIDENCE" actualValue="4" weight=".059"
                               rank="5"/>
                              </Details>
 
 101285  79    42.18    36.82  <Details algorithm="Support Vector Machines">
                               <Attribute name="HOME_THEATER_PACKAGE" actualValue="1" weight=".059"
                                rank="1"/>
                               <Attribute name="HOUSEHOLD_SIZE" actualValue="2" weight=".059"
                                rank="2"/>
                               <Attribute name="CUST_MARITAL_STATUS" actualValue="Mabsent"
                                weight=".059" rank="3"/>
                               <Attribute name="Y_BOX_GAMES" actualValue="0" weight=".059"
                                rank="4"/>
                               <Attribute name="OCCUPATION" actualValue="Prof." weight=".059"
                                rank="5"/>
                               </Details>
 
 100694   77    41.04    35.96  <Details algorithm="Support Vector Machines">
                                <Attribute name="HOME_THEATER_PACKAGE" actualValue="1"
                                 weight=".059" rank="1"/>
                                <Attribute name="EDUCATION" actualValue="&lt; Bach." weight=".059"
                                 rank="2"/>
                                <Attribute name="Y_BOX_GAMES" actualValue="0" weight=".059"
                                 rank="3"/>
                                <Attribute name="CUST_ID" actualValue="100694" weight=".059"
                                 rank="4"/>
                                <Attribute name="COUNTRY_NAME" actualValue="United States of
                                 America" weight=".059" rank="5"/>
                                </Details>
 
 100308  81    45.33    35.67  <Details algorithm="Support Vector Machines">
                               <Attribute name="HOME_THEATER_PACKAGE" actualValue="1" weight=".059"
                                rank="1"/>
                               <Attribute name="Y_BOX_GAMES" actualValue="0" weight=".059"
                                rank="2"/>
                               <Attribute name="HOUSEHOLD_SIZE" actualValue="2" weight=".059"
                                rank="3"/>
                               <Attribute name="FLAT_PANEL_MONITOR" actualValue="1" weight=".059"
                                rank="4"/>
                               <Attribute name="CUST_GENDER" actualValue="F" weight=".059"
                                rank="5"/>
                               </Details>
 
 101256  90    54.39    35.61  <Details algorithm="Support Vector Machines">
                               <Attribute name="YRS_RESIDENCE" actualValue="9" weight=".059"
                                rank="1"/>
                               <Attribute name="HOME_THEATER_PACKAGE" actualValue="1" weight=".059"
                                rank="2"/>
                               <Attribute name="EDUCATION" actualValue="&lt; Bach." weight=".059"
                                rank="3"/>
                               <Attribute name="Y_BOX_GAMES" actualValue="0" weight=".059"
                                rank="4"/>
                               <Attribute name="COUNTRY_NAME" actualValue="United States of
                                America" weight=".059" rank="5"/>
                               </Details>

 


출처: 오라클 레퍼런스

원문 링크: Oracle PREDICTION_DETAILS 함수 문서

 

반응형

댓글