전처리
-
R과 데이터프레임(2) : dplyrR 이모저모 2019. 3. 14. 23:46
R에서의 데이터프레임 기초와 활용방법(2) 저번 포스팅에선 R에서 데이터프레임을 생성하고 살펴보는 것을 위주로 살펴보았습니다. 이번 포스팅에서는 dplyr이라는 패키지를 활용하여 실제 분석 업무를 진행하며 어떻게 활용할 수 있는지에 대해 얘기해보도록 하겠습니다. 1. dplyr 패키지 dplyr은 데이터를 자르고 붙이는데 유용하게 쓰던 plyr패키지를 dataframe 오브젝트에 보다 유연하게 사용하도록 만든 패키지로, R에서 데이터 사이언스를 위해 소개하는 패키지 묶음들인 Tidyverse의 패키지들 중 가장 흔히 볼 수 있는 패키지이기도 합니다. 이는 dplyr이 chain function이라는 것을 제공하기 때문인데요. %>%으로 사용하는 이 함수는 앞의 결과값을 뒤의 함수에 활용할 수 있도록 해주..