• ggplot에 대해 알아보자

    2017. 8. 4. 10:15

    by. 위지원

    ggplot이란 http://ggplot2.org/

    -R의 그래픽 패키지로써 R에서 시각화를 다룰때에 보편적으로 많이  사용하는 패키지이다.

    -ggplot을 해들리위캠이라는 교수가 개발한것으로  ggplot이 개발전/후로 R은 나뉜다. 라고 할정도라고..

    -데이터기반의 문법으로 점,선막대등의 기하학적 객체들을 색상,모양,크기와 같은 미적 특성을 매핑하여 적용하는 원리로 통계 변환을 그래프에 포함시킬 수 있다. 그러므로 ggplot을 이용할때는 꼭 데이터프레임 형태로 데이터형식을 만들어놔야한다.(데이터기반이기때문에)



    ggplot의 기본은 qplot()

    R에서 기본적으로 그래프를 그릴 수 있는 plot()과 비슷하며 aesthetics(크기,모양,색상) geoms(점,선 등)으로 구성된다.


    Factor의 중요성

    R에는 두가지 factor가 있다.

    -순서가 있는

    -순서가 없는 일반요인

    순서가 정말로 없다는게 아니라, 순서가 의미가 있다.없다라는것이다. 두가지 모두 어떤 '순서'로든 정렬은 된다.그래서 구분은 무의미하다.

    일반요인도 데이터가 어떻게 저장하는지만 순서로 반영한다.


    이러한 순서는 그래픽 출력에 영향을 미친다.



    써보자.

    ...ㅎ 알 수 없는 패키지라고 설치할 수 없다. 알고보니 나의 r-base  버전이 오래된것이였다!(3.0.2) 최신버전(3.2.2)을 설치해보자


    wget https://cran.rstudio.com/src/base/R-3/R-3.2.2.tar.gz
    tar xvf R-3.2.2.tar.gz
    cd R-3.2.2
    sudo apt-get install gcc
    sudo apt-get install fort77
    sudo apt-get install aptitude
    sudo aptitude install g++
    sudo aptitude install xorg-dev
    sudo aptitude install libreadline-dev
    sudo aptitude install gfortran
    gfortran --version
    ./configure
    sudo add-apt-repository ppa:webupd8team/java -y
    sudo apt-get update
    sudo apt-get install oracle-java8-installer
    sudo apt-get install oracle-java8-set-default
    java -version
    # need to build shared library (--enable-R-shlib)
    sudo ./configure --enable-R-shlib      # the --enable-R-shlib option is needed for the RStudio IDE to work
    sudo make
    sudo make install
    R --version

    출처 https://askubuntu.com/questions/798335/how-you-install-r-3-2-2-in-ubuntu-14-04-ltsvagelis 님의 답변




    버전 업그레이드가 아주 잘 되었다 ^0^


    rstudio에 접근하는 법은  http://ip주소:8787 로 접근하면 된다.



    ggplot2도 잘 설치된다 ㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎㅎ넘모 싱난다..

    이 팝업은 오른쪽 하단에 보면 files plots paxkages help viewer가 있는데 여기 packages를 누르고 install을 누르면 나온다


    예제를 따라해보자


    일단 이런 데이터셋이 있다.


    qplot(displ,hwy,data=mpg)


    mpg의 displ와 hwy에 대해서 그래프를 그려보자



    Tada~~ 아주 이쁘게 잘그려준다!

    qplot(displ,hwy,data=mpg,color=drv)로 색상을 추가할 수도 있다.



    qplot(hwy,data=mpg,fill=drv)로 히스토그램을 그릴수도있다.



    qplot(displ,hwy,data=mpg,fill=drv)를 이용하여 위에서 겹쳐지는 4,f,r에 대해여 분리하여 볼 수 있다.



    다이아몬드에 대한 데이터로 그래프를 한번 그려봤다



    활용만 잘한다면 정말 좋은 그래프를 나타낼 수 있는 것 같다.




    출처url

    http://visualize.tistory.com/87

    http://freesearch.pe.kr/archives/3134







    '2017년 > Database' 카테고리의 다른 글

    sqlite에서 지원하지 않는! 것들!  (0) 2017.08.10
    python orm sqlalchemy를 써보자[1.1.x]기준 2부  (0) 2017.08.06
    R이란? 2부  (0) 2017.08.02
    HBASE란?  (0) 2017.07.21
    R이란?  (0) 2017.07.12

    대화의 장 💬