2018년/spark
GraphX ~그래프 생성까지
GraphX는 스파크의 서브 모듈로 대용량 데이터의 분산 및 병렬 그래프 처리를 지원합니다. 그래프 데이터는 Vertex와 Edge로 이루어져있습니다. 시작하기 전에 spark를 실행시키고 해봅시다. 필요한 친구들을 import 해주면 세팅은 끝..아래에 나오는 모든 예제는>>GraphX 공식 사이트 GraphX 공식 사이트에 보면 기본 알고리즘을 제공합니다. 우리는 이를 이용하여 데이터 전처리부터 분석단계까지 스파크 기능을 사용할 수 있습니다. 그래프는 다음과 같이 4가지의 형태를 가지고 있습니다. 속성그래프 : 각 vertex와 edge가 연관된 속성을 가지고 있는 방향 멀티 그래프 속성 그래프에 대한 예제를 실행해보겠습니다. VertexID를 각 Vertex를 식별할 key로 가집니다.*scala에..
2018. 4. 2. 19:36