논문 10

[논문 리뷰] wide & deep learning for recommender system

논문 : https://arxiv.org/abs/1606.07792 더보기 오역, 오류 등은 댓글로 말씀 부탁드립니다! 문제 상황 nonlinear feature transformation을 사용한 GLM input data가 sparse할 때 사용 cross - product feature transformation을 통한 feature 상호작용 memorization 좋은 성능을 보이지만 feature engineering이 더 필요하다 적은 feature engineering sparse feature에 맞게 학습된 저차원의 dense embedding에 대해 DNN 일반화 성능 높음 단, user-item 상호작용이 sparse 하고 순위가 높은 경우 과소적합 및 추천 성능 하락 문제 추천시스템의..

[논문 리뷰] BPR : bayesian personalized ranking from implicit feedback

논문 : https://arxiv.org/abs/1205.2618 더보기 오역, 오류 등은 댓글로 말씀 부탁드립니다! 문제 상황 상품 추천 : 선호도 기반 사용자 맞춤형 ranking 계산 선호도 : 과거 구매 기록 및 열람 기록을 통해 계산 현업에서 대부분의 feedback은 implicit feedback implicit feedback : 클릭 및 조회 등 수집 쉬움 explicit feedback : 평점 목적 : 사용자 맞춤형 순위 학습 모델을 위한 일반적인 방법 제시 이전 연구 collaborative model KNN - CF : 가장 유명한 모델 휴리스틱하게 유사도 계산 최근에는 유사도 matrix를 모델 파라미터로 사용하여 task에 맞게 학습시켰다 SVD : feature 학습에 사용 ..

[논문 리뷰] Session-based Recommendations with Recurrent Neural Networks

논문 : https://arxiv.org/abs/1511.06939 오역, 오류 등은 댓글로 말씀 부탁드립니다! BackGround 세션 기반 데이터 기존의 추천시스템 : 긴 사용자 기록 대신 짧은 세션 기반 데이터 사용 MF 정확성이 떨어지는 원인 → 현업에서는 아이템 기반 추천으로 MF 정확성 하락 극복 세션 기반 추천시스템 낮은 활용성 데이터 부족 대부분의 이커머스, 뉴스, 미디어 : 사용자별로 행동을 추적하지 않음 → 세션 기반 데이터X 쿠키, 브라우저 지문 데이터는 충분하지 않고 사생활 침해 위험이 있음 트래킹이 가능하더라도 1~2개의 세션만 가지고 있는 경우가 대부분 같은 사용자의 후속 세션은 독립적으로 처리해야 기존 모델 사용자 프로필을 사용하지 않음 과거의 클릭 정보를 무시하고 가장 마지막..

[논문 리뷰] Neural News Recommendation with Long- and Short-term User Representations

논문 : https://aclanthology.org/P19-1033/ 오역, 오류 등은 댓글로 말씀 부탁드립니다! BackGround 뉴스 추천시스템 개인화된 뉴스 추천시스템 : 방대한 양의 뉴스 중에 관심있는 콘텐츠를 찾고 정보 과부하를 완화하는데 도움 사용자의 선호를 나타내는 정확한 representation을 학습하는 것이 중요 기존 추천시스템 모델 : single representation 학습 single representation : 과거 열람 기록, 추천 기사와 실제 열람한 기사의 유사도 기반 열람 기록 과거의 열람 기록 : 너무 길다 추천 기사와 실제 열람한 기사의 유사도 기반 열람 기록 : latency 발생, 대규모 저장공간 필요 long, short term 선호를 나타내기에는 부족..

[논문 리뷰] Neural Graph Collaborative Filtering

논문 : https://arxiv.org/abs/1905.08108 오역, 오류는 댓글로 말씀 부탁드립니다! 문제 상황 : Collaborative signal capture 기존 모델 가정 : 유사한 사용자는 특정 상품에 대해 유사한 선호도를 보일 것 과정 embedding : 상호작용을 재구축하기 위해 user, item을 파라미터화 파라미터를 기반으로 선호도 예측 이미 존재하는 feature로부터 mapping하는 방법 단점 : 충분하지 않은 collaborative signal 상호작용 모델링 : embedding 기반으로 과거 상호작용 재구축 단점 : 주요 collaborative signal을 명시적으로 인코딩하지 않음 (= 상호작용을 고려하지 않음) collaborative signal : ..

[논문 리뷰] Deep Neural Networks for YouTube Recommendations

논문 : https://static.googleusercontent.com/media/research.google.com/ko//pubs/archive/45530.pdf * 이번 논문은 유튜브 알고리즘에 대한 논문입니다. 제목에서 알 수 있듯이 기존의 전반적인 추천 성능 개선에 초점을 둔 논문과 달리, 하나의 플랫폼에서 추천 성능을 개선하는 데에 초점을 두고 있습니다. 그래서 다른 논문보다는 조금 말랑말랑한 느낌입니다. 오역, 오류는 댓글로 말씀 부탁드립니다! Youtube 추천시스템 Overview 고려사항 scale : 대규모 사용자와 아이템에 사용된다 freshness : 실시간으로 발생하는 사용자 행동, 실시간으로 업로드되는 영상을 반영해야함 noise : sparsity, 보이지 않는 외부 요인..

[논문 리뷰] Neural Collaborative Filtering

논문 : https://arxiv.org/abs/1708.05031 Background 1. Learning From Implicit Data Implicit Data가 없는 경우 : 인지X or 부정적으로 평가 data가 없는 이유를 구분하기 어렵기 때문에 item 간 순위를 선정할 경우 noise 발생 목적 함수 pointwise loss : 실제와 예측 간의 오차를 감소시키는 방향으로 학습 유연하게 negative sample 비율 조정 가능 pairwise loss : 관측된 경우와 관측되지 않은 경우 간의 margin을 최대화하는 방향으로 학습 관측된 경우의 순위가 관측되지 않은 경우의 순위보다 높음 2. Matrix Factorization 잠재 feature 벡터를 이용해 공유된 잠재 공간에..

[논문 리뷰] “Told You I Didn’t Like It”: Exploiting Uninteresting Items for Effective Collaborative Filtering

논문 : https://pike.psu.edu/publications/icde16.pdf 오역, 오류 등은 댓글로 말씀 부탁드립니다! Background 1. Collaborative Filtering 구분 기억 기반 : 이웃과의 유사성을 이용해 평점 예측 사용자는 이웃이 선호하는 아이템을 선호할 가능성이 높다는 사실에 기반 모델 기반 : 모델을 이용해 평점 예측 사용 목적 사용자 평점 예측 상위 N개 상품 추천 : 평가하지 않은 아이템에 대한 상대적인 선호를 예측하여 예측값이 높은 N개를 추천 개선 방안 : uninteresting item을 추천 대상에서 제외 2. OCCF Problem sparse한 학습 데이터로 인해 non positive 데이터를 해석하기 어려움 negative 라벨링되지 않은..

[논문 리뷰] xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems

논문 : https://arxiv.org/abs/1803.05170 오역, 오류 등은 댓글로 말씀 부탁드립니다! Background 전통적인 추천시스템 Non factorization model 대규모 추천시스템의 input feature : sparse, 카테고리-연속형 혼합, 고차원 선형 모델이 다루기 쉬운 구조 선형 모델 : feature 상호작용을 학습하지 않음 → cross feature 엔지니어링 필요 Cross Feature Transformation : 최적의 결과를 도출하기 위해 필요 High-order feature 확보: 잠재적 패턴을 탐색 필요 - 많은 시간(비용)이 소요됨 대규모 예측 시스템 : 모든 cross feature를 수동적으로 추출할 수 없음 hand-craft cros..

[논문 리뷰] One-Class Collaborative Filtering

오늘부터는 추천시스템 논문을 리뷰해보려고 합니다. 사실 리뷰라기보다는 해석에 가깝지만요 ㅎㅎ 논문 읽는 속도가 느린 편이라 포스팅을 자주 하지는 못할 것 같지만 꾸준히 해보려고 합니다. 첫 번째로 리뷰할 논문은 One-Class Collaborative Filtering입니다. 논문 : http://www.rongpan.net/publications/pan-oneclasscf.pdf 오역, 오류 등은 댓글로 말씀 부탁드립니다! Background OCCF Problem 추천 시스템의 학습 데이터 : 단순히 사용자의 액션 여부를 나타내는 binary data = sparse non-positive 해석 시 모호 : non-positive = negative + 라벨링 되지 않은 긍정 data 둘을 분리하기..

반응형