-
1. 원핫 인코딩을 통해 게임 간 거리 계산하기
게임별로 장르를 가지고 있다.
이 값을 이용하여 간단한 게임간의 거리계산을 통해 비슷한 게임을 추천받고자 한다.
시작하기에 앞서서 게임별로 각 장르의 원핫 인코딩을 진행했다. 결과는 아래와 같다.
가장 마지막에 있던 게임과 다른 게임간의 거리를 계산했다. TOP5를 뽑은 결과는 아래와 같다.
액션/어드벤처/인디 정도가 공통으로 들어있었고, 전략을 제외하고는 7Days to Die가 거의 같은 장르의 게임이었다.(포함관계..ㄷㄷ)
위에 결과로 나온 게임들을 각각 사이트에 가서 확인해봤다.
ㅋㅋㅋㅋㅋㅋ 으앗ㅋㅋㅋㅋ ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 너무 다른 형태의 게임인 것 같은데...
아하핫..! 장르는 크게 도움이 되지 못하나보다.... 이런 어처구니 없는 결과가 나와도 재밌다 참ㅋㅋ
그래서 이번에는 좀 더 세분화되어있는 카테고리를 이용했다.
아까보다는 뭔가 추천 퀄리티가 좋아진 것 같기도하고..(그렇게 믿고싶은걸지도)
그래도 첫번 째 게임이 target data와 비슷한 류의 게임이라는 느낌은 든다. 처음 결과보단 ㅠ.ㅠ
나는 위처3를 사놓고 40분도 채 플레이 하지 못했다. 오픈월드는 쥐약이다. 뭘해야할지 모름.;; 더보기에러 해결
아래와 같은 에러는 tweepy를 버전을 명시해서 설치해주면 된다.
module 'tweepy' has no attribute 'StreamListener'
pip install tweepy==3.10.0
아래와 같은 에러는 JPYPE를 다운로드 받고 pip로 설치하면 된다(파이썬 버전이랑 주의깊게 보도록.. 파이썬 버전 안맞는거 받아서 한참 뭐지? 했다)
JVMNotFoundException: No JVM shared library file (jvm.dll) found. Try setting up the JAVA_HOME environment variable properly.
https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype
아래와 같은 에러는 jpype1을 설치해주면 된다
NameError: name 'jpype' is not define
pip install JPype1
더보기FastText 잠깐 써보기 .. 나중에 유용할 수도 있으니,,, 그리구 재밌다 ^0^!
페이스북에서 개발한 Word2Vec의 일종이다. FastText는 Word2Vec과 달리 하나의 '단어' 안 에 '단어'가 또 있을 것이다(SubWord). 라는 전재로 진행된다.
빈도 수가 적은 단어에 대해서도 오타를 포함해 학습하거나, 다른 단어의 n-gram을 고려해 학습하는 부분 또한 word2vec보다 훨씬 강한 이점이다.(word2vec은 근데 그만큼 너무 오래됐..)
아래 사이트에 pretraining된 모델이 있으며 한국어 모델도 존재한다. 학습데이터는 아래에서 얻었다고 한다.
We distribute pre-trained word vectors for 157 languages, trained on Common Crawl and Wikipedia using fastText.
fastText
Library for efficient text classification and representation learning
fasttext.cc
아래처럼 gensim을 통해 진행할 수 있다.
from gensim import models ko_model = models.fasttext.load_facebook_model('get_data/cc.ko.300.bin.gz') for w, sim in ko_model.wv.most_similar('블라블라'): print(f'{w}: {sim}')
ㅋㅋㅋ 너무그런가.. 무명인과 유명인의 차이..? 하하^^;; 그래도 학습이 잘되어있다는 것을 알 수 있다 ㅎㅎ..
REFERENCES
https://jpype.readthedocs.io/en/latest/install.html
https://velog.io/@junyoung9696/Konlpy-%EC%98%A4%EB%A5%98%EC%8B%9C-%EC%B0%B8%EA%B3%A0
'2021년 > 21.下' 카테고리의 다른 글
Build a Steam Game Recomend Model (2/?) - 단순 랭킹으로 추천하기 (0) 2021.12.14 Build a Steam Game Recomend Model (1/?) - 데이터 수집 경로 결정하기 (5) 2021.12.08 airflow 설치 기록용... (0) 2021.11.05 airflow log가 제대로 안나올 때 (0) 2021.11.05 windows 10에서 ubutu 사용하기 (0) 2021.11.04