데이터 요약
-
R과 데이터프레임(3)R 이모저모 2019. 3. 24. 21:41
R에서의 데이터프레임 기초와 활용방법(3) 저번 포스팅에선 R에서 dplyr패키지를 이용해서 데이터프레임을 다루는 방법들을 소개하고, 간단한 문제풀이 느낌의 리뷰도 해보았습니다. 이번 포스팅에선 dplyr 관련 포스팅을 마무리 지어보도록 하겠습니다. 1. dplyr과 데이터 병합 데이터 분석 업무를 하다 보면 여러 DB에 흩어져 있는 데이터들 중 쓸모 있는 것들을 선별해서 하나의 데이터 셋으로 병합해야 하는 경우가 많습니다. dplyr을 쓰지 않는다면 merge를 사용하는 경우가 많지만 merge는 데이터 크기가 크고 키 값이 복잡해지면 처리속도 때문에 마냥 기다려 주기가 버겁습니다. 이 점을 해결하기 위해 dplyr에선 데이터 병합을 위한 함수로 _join 시리즈를 제공하고 있습니다. 표의 설명들을 보..