위지원의 데이터 일기 🐈
Home
  • 분류 전체보기 (563)
    • ✎ 2025년 (4)
    • 2024년 (16)
    • 2023년 (6)
    • 2022년 (35)
      • Developement (22)
      • Error (9)
    • 2021년 (68)
      • ERROR (9)
      • 알고리즘 (11)
      • 개발공부 (21)
      • Data (15)
      • 21.下 (12)
    • 2020년 (164)
      • 코테 (84)
      • Development (29)
      • 정처기 (41)
    • 2019년 (27)
    • 2018년 (89)
      • English Speaking (8)
      • Error (12)
      • C, Java, FileSystem (13)
      • DataBase (15)
      • Java (2)
      • 지식 (16)
      • Go (3)
      • spark (9)
      • 영어 (5)
      • 알고리즘 (6)
    • 2017년 (143)
      • Error (17)
      • machine learning (16)
      • Spark (20)
      • Database (19)
      • Python (17)
      • Spring (9)
      • etc. (10)
      • 백준 (5)
      • Google Platform (12)
      • web Development (7)
      • Docker (3)
      • Linux (8)
Home
  • 분류 전체보기 (563)
    • ✎ 2025년 (4)
    • 2024년 (16)
    • 2023년 (6)
    • 2022년 (35)
      • Developement (22)
      • Error (9)
    • 2021년 (68)
      • ERROR (9)
      • 알고리즘 (11)
      • 개발공부 (21)
      • Data (15)
      • 21.下 (12)
    • 2020년 (164)
      • 코테 (84)
      • Development (29)
      • 정처기 (41)
    • 2019년 (27)
    • 2018년 (89)
      • English Speaking (8)
      • Error (12)
      • C, Java, FileSystem (13)
      • DataBase (15)
      • Java (2)
      • 지식 (16)
      • Go (3)
      • spark (9)
      • 영어 (5)
      • 알고리즘 (6)
    • 2017년 (143)
      • Error (17)
      • machine learning (16)
      • Spark (20)
      • Database (19)
      • Python (17)
      • Spring (9)
      • etc. (10)
      • 백준 (5)
      • Google Platform (12)
      • web Development (7)
      • Docker (3)
      • Linux (8)
블로그 내 검색
포트폴리오

위지원의 데이터 일기 🐈

데이터를 사랑하고 궁금해하는 기록쟁이입니다! 😉 Super Data Girl이 되는 그날까지🏃‍♀️ 화이팅!

  • 🖥 깃블로그
  • 🌍 위키원
  • 📑 내맘대로 스크랩
  • 💌 메일
  • 2021년/21.下

    Build a Steam Game Recomend Model (2/?) - 단순 랭킹으로 추천하기

    2021. 12. 14. 13:36

    by. 위지원

    2021.12.08 - [✎ 21.下/All(임시)] - [Toy Project] Build a Steam Game Recomend Model (1/?) - 데이터 수집 경로 결정하기

     

     

    요즘 플젝 마감시즌이라 너무 바쁘다... T.T 흐잉 제대로 하고싶은데 끄윽..


     

    우선은 user 정보없이 딱 게임 정보에 한해서 진행해보려고 한다.

     

    1. 가장 간단하게 만들기

    우선 가지고 있는 데이터를 가지고 sorted result 기반으로 추천을 해보려한다.(모델 사용 無)

    데이터를 필요에 의해 조금 정제해주고 그냥 단순하게 긍정리뷰 비율+추천 수로 랭킹을 매겨봤다.

     

     

    reviews 데이터에는 해당 리뷰가 얼마나 유용한지 voting 하는 기능이 있는데 이를 가중치로 추가해서 진행해봤다.

    크게 차이는 없다.. 

     

     

    2. play time 으로 작업하기

    아래 두 글을 참조했을 때, 유저의 palytime을 중요시 여기고있었다. 

    맞는 말이다. 나역시 스팀 라이브러리에서 플레이시간을 살펴보고있자면 내가 이게임에 대한 애정도가 얼마나되는지 알 수 있다.. (몇 분밖에 안해놓고 환불마저 귀찮은 그런 사랑스럽지 않은 게임들도 있다..)

    https://github.com/raghavjajodia/steamGameRec/blob/master/Project_Report.pdf , https://medium.com/@isabel.susan.joseph/steam-recommendation-system-5d40fe6a0e26

     

    해당 게임을 플레이한 유저들의 플레이 타임을 어떻게 알 수 있을까?

    지금 내가 가지고 있는 데이터에서 review 데이터를 이용하면 좋을 것 같았으며, 각 게임별로 play time mean time을 구해서 feature로 사용하였다. 결과는 아래와 같았다. 

    어떤 컬럼에 더 비중을 두느냐에 따라 결과가 많이 바뀌었다. 

     

    우선적으로 가지고 있는 데이터에서 모델없이 진행할 수 있는건 이정도같다. (물론 더 있겠지만..)

    다음엔 nlp나 clustering을 진행해보려고 한다 :)


    삽질 

    데이터를 이리저리 만지다가 아주 이상한 현상을 발견했다. 리뷰가 하나도 수집이 되지않은 것이다..

    실제로는 리뷰가 존재한다. 

     

    api 자체에서 리뷰를 잡지 못한다... 으아악 왜이래 ㅠㅠ 이러면 다른 게임도 리뷰를 온전히 가져오지 못할 수도 있다는 생각이... 검색해도 딱히 내용이 없어서 우선적으론 패스하기로..

    MEMO: 크롤링하면 될 것같다. 그러나 내 임의로 사이트 크롤링해도 되는지도 확인해야하기때문에, 우선은 api로 얻을 수 있는 데이터만 모으는걸로 ㅠㅠ

     

    SOURCE CODE

     

    GitHub - weejiwon-95/steamRecommendation

    Contribute to weejiwon-95/steamRecommendation development by creating an account on GitHub.

    github.com

     

     

    REFERENCES

    https://brunch.co.kr/@mobiinside/863

    https://medium.com/daangn/%EA%B8%80%EC%93%B0%EA%B8%B0-%EC%B9%B4%ED%85%8C%EA%B3%A0%EB%A6%AC-%EC%B6%94%EC%B2%9C%EB%AA%A8%EB%8D%B8-%EA%B0%9C%EB%B0%9C%ED%95%98%EA%B8%B0-cbbcc43e1f7f

    https://bskyvision.com/849

    저작자표시 (새창열림)

    '2021년 > 21.下' 카테고리의 다른 글

    Build a Steam Game Recomend Model (3/?) - 원핫인코딩  (0) 2021.12.27
    Build a Steam Game Recomend Model (1/?) - 데이터 수집 경로 결정하기  (5) 2021.12.08
    airflow 설치 기록용...  (0) 2021.11.05
    airflow log가 제대로 안나올 때  (1) 2021.11.05
    windows 10에서 ubutu 사용하기  (0) 2021.11.04

    잠깐만요~! 읽으신김에 이런 글들은 어떠세요? 👀

    • Build a Steam Game Recomend Model (3/?) - 원핫인코딩 2021.12.27
    • Build a Steam Game Recomend Model (1/?) - 데이터 수집 경로 결정하기 2021.12.08
    • airflow 설치 기록용... 2021.11.05
    • airflow log가 제대로 안나올 때 2021.11.05
    맨 위로
전체 글 보기
Tistory 로그인
Tistory 로그아웃
로그아웃 글쓰기 관리

열정! 열정! 열정! 🔥

Designed by Nana
블로그 이미지
위지원
데이터 엔지니어로 근무 중에 있으며 데이터와 관련된 일을 모두 좋아합니다!. 특히 ETL 부분에 관심이 가장 크며 데이터를 빛이나게 가공하는 일을 좋아한답니다 ✨

티스토리툴바

티스토리툴바