-
요즘 플젝 마감시즌이라 너무 바쁘다... T.T 흐잉 제대로 하고싶은데 끄윽..
우선은 user 정보없이 딱 게임 정보에 한해서 진행해보려고 한다.
1. 가장 간단하게 만들기
우선 가지고 있는 데이터를 가지고 sorted result 기반으로 추천을 해보려한다.(모델 사용 無)
데이터를 필요에 의해 조금 정제해주고 그냥 단순하게 긍정리뷰 비율+추천 수로 랭킹을 매겨봤다.
reviews 데이터에는 해당 리뷰가 얼마나 유용한지 voting 하는 기능이 있는데 이를 가중치로 추가해서 진행해봤다.
크게 차이는 없다..
2. play time 으로 작업하기
아래 두 글을 참조했을 때, 유저의 palytime을 중요시 여기고있었다.
맞는 말이다. 나역시 스팀 라이브러리에서 플레이시간을 살펴보고있자면 내가 이게임에 대한 애정도가 얼마나되는지 알 수 있다.. (몇 분밖에 안해놓고 환불마저 귀찮은 그런 사랑스럽지 않은 게임들도 있다..)
https://github.com/raghavjajodia/steamGameRec/blob/master/Project_Report.pdf , https://medium.com/@isabel.susan.joseph/steam-recommendation-system-5d40fe6a0e26
해당 게임을 플레이한 유저들의 플레이 타임을 어떻게 알 수 있을까?
지금 내가 가지고 있는 데이터에서 review 데이터를 이용하면 좋을 것 같았으며, 각 게임별로 play time mean time을 구해서 feature로 사용하였다. 결과는 아래와 같았다.
어떤 컬럼에 더 비중을 두느냐에 따라 결과가 많이 바뀌었다.
우선적으로 가지고 있는 데이터에서 모델없이 진행할 수 있는건 이정도같다. (물론 더 있겠지만..)
다음엔 nlp나 clustering을 진행해보려고 한다 :)
삽질
데이터를 이리저리 만지다가 아주 이상한 현상을 발견했다. 리뷰가 하나도 수집이 되지않은 것이다..
실제로는 리뷰가 존재한다.
api 자체에서 리뷰를 잡지 못한다... 으아악 왜이래 ㅠㅠ 이러면 다른 게임도 리뷰를 온전히 가져오지 못할 수도 있다는 생각이... 검색해도 딱히 내용이 없어서 우선적으론 패스하기로..
MEMO: 크롤링하면 될 것같다. 그러나 내 임의로 사이트 크롤링해도 되는지도 확인해야하기때문에, 우선은 api로 얻을 수 있는 데이터만 모으는걸로 ㅠㅠ
SOURCE CODE
REFERENCES
'2021년 > 21.下' 카테고리의 다른 글
Build a Steam Game Recomend Model (3/?) - 원핫인코딩 (0) 2021.12.27 Build a Steam Game Recomend Model (1/?) - 데이터 수집 경로 결정하기 (5) 2021.12.08 airflow 설치 기록용... (0) 2021.11.05 airflow log가 제대로 안나올 때 (0) 2021.11.05 windows 10에서 ubutu 사용하기 (0) 2021.11.04