[Model/Metric] 모델 정량 평가를 위한 metric #74
Replies: 3 comments 1 reply
-
metric with near candidate filteringTBD |
Beta Was this translation helpful? Give feedback.
-
|
metric 정의하면서 했던 생각을 여기에 함께 정리할게요. notation
|
Beta Was this translation helpful? Give feedback.
-
|
LightGBM 실험 결과 공유드립니다.
Evaluation Results
MAP에서는 큰 차이가 없으나 NDCG에서는 차이가 매우 큽니다. 이는 먼가 m < K인 경우에 따라 영향이 있는것으로 보여집니다. |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
metric without considering near candidate filtering
mean Average Precision (mAP)
mAP는 모든 유저의 AP에 대한 평균입니다.
AP는 각 유저별로 계산되며 아래와 같이 정의됩니다.
각 notation의 정의는 아래와 같습니다.
문헌에 따라서, AP을 아래와 같이 정의하기도 합니다.
Normalized Discounted Cumulative Gain
NDCG는 모든 유저의 NDCG에 대한 평균입니다.
각 유저별로 계산되는 NDCG는 아래와 같습니다.
첨자를 빼고 정의하겠습니다. DCG, IDCG는 아래와 같이 정의됩니다.
여기서 m은 유저가 상호작용한 아이템의 수 입니다. IDCG는 DCG의 최대값입니다. 즉, 추천을 가장 잘 했을 때의 DCG 값입니다.
아래의 예시를 생각해보겠습니다.
[2,6,10][2,5,6,3,1]가장 best 추천은 유저가 좋아한 아이템 [2,6,10]을 상위 3개 아이템에 배치하는 것입니다 ->
[2,6,10,*,*]아이템에 대한 유저의 선호도가 표현되어 있지 않다면,
[2,6,10,*,*]이든,[6,10,2,*,*]이든 동일하게 best 추천입니다.이때의 DCG, 즉 IDCG는 아래와 같습니다.
유저에게
[2,5,6,3,1]의 순서로 아이템을 추천했다면, item 2,6은 잘 추천한 것이고 5,3,1은 틀리게 추천한 것입니다. 이때의 DCG는 아래와 같습니다.5,3,1은 유저가 좋아한 아이템이 아니므로, DCG 계산에서 제외됩니다.
Beta Was this translation helpful? Give feedback.
All reactions