데이터분석
-
R과 데이터프레임(3)R 이모저모 2019. 3. 24. 21:41
R에서의 데이터프레임 기초와 활용방법(3) 저번 포스팅에선 R에서 dplyr패키지를 이용해서 데이터프레임을 다루는 방법들을 소개하고, 간단한 문제풀이 느낌의 리뷰도 해보았습니다. 이번 포스팅에선 dplyr 관련 포스팅을 마무리 지어보도록 하겠습니다. 1. dplyr과 데이터 병합 데이터 분석 업무를 하다 보면 여러 DB에 흩어져 있는 데이터들 중 쓸모 있는 것들을 선별해서 하나의 데이터 셋으로 병합해야 하는 경우가 많습니다. dplyr을 쓰지 않는다면 merge를 사용하는 경우가 많지만 merge는 데이터 크기가 크고 키 값이 복잡해지면 처리속도 때문에 마냥 기다려 주기가 버겁습니다. 이 점을 해결하기 위해 dplyr에선 데이터 병합을 위한 함수로 _join 시리즈를 제공하고 있습니다. 표의 설명들을 보..
-
R과 데이터프레임 (1)R 이모저모 2019. 3. 10. 22:31
R에서의 데이터프레임 기초와 활용방법 R에서 데이터프레임은 직관적이며 dplyr등 tidyverse 패키지들로 다루기 쉽기 때문에 여러 패키지가 Input, 혹은 Output으로 활용하는 데이터 타입입니다. 이 포스팅에서는 데이터프레임이 어떤 역할을 하고 어떻게 생성하는지에 대한 기초를 알아보고자 합니다. 1. R 데이터프레임의 정의 데이터프레임은 R에 있는 2차원 데이터 형식의 하나로, 데이터프레임에 대해서 설명하는 말들은 여러 곳에서 찾아볼 수 있지만, R Documentation에서는 간단히 A data frame is a list of variables of the same number of rows with unique row names, given class "data.frame" 으로 서술하..