데이터프레임
-
R과 데이터프레임(2) : dplyrR 이모저모 2019. 3. 14. 23:46
R에서의 데이터프레임 기초와 활용방법(2) 저번 포스팅에선 R에서 데이터프레임을 생성하고 살펴보는 것을 위주로 살펴보았습니다. 이번 포스팅에서는 dplyr이라는 패키지를 활용하여 실제 분석 업무를 진행하며 어떻게 활용할 수 있는지에 대해 얘기해보도록 하겠습니다. 1. dplyr 패키지 dplyr은 데이터를 자르고 붙이는데 유용하게 쓰던 plyr패키지를 dataframe 오브젝트에 보다 유연하게 사용하도록 만든 패키지로, R에서 데이터 사이언스를 위해 소개하는 패키지 묶음들인 Tidyverse의 패키지들 중 가장 흔히 볼 수 있는 패키지이기도 합니다. 이는 dplyr이 chain function이라는 것을 제공하기 때문인데요. %>%으로 사용하는 이 함수는 앞의 결과값을 뒤의 함수에 활용할 수 있도록 해주..
-
R과 데이터프레임 (1)R 이모저모 2019. 3. 10. 22:31
R에서의 데이터프레임 기초와 활용방법 R에서 데이터프레임은 직관적이며 dplyr등 tidyverse 패키지들로 다루기 쉽기 때문에 여러 패키지가 Input, 혹은 Output으로 활용하는 데이터 타입입니다. 이 포스팅에서는 데이터프레임이 어떤 역할을 하고 어떻게 생성하는지에 대한 기초를 알아보고자 합니다. 1. R 데이터프레임의 정의 데이터프레임은 R에 있는 2차원 데이터 형식의 하나로, 데이터프레임에 대해서 설명하는 말들은 여러 곳에서 찾아볼 수 있지만, R Documentation에서는 간단히 A data frame is a list of variables of the same number of rows with unique row names, given class "data.frame" 으로 서술하..