R언어는 기본 구문이 아주 번잡하고, dplyr패키지를 사용해야만 간결한 파이프 구문을 작성할 수 있다.
그런데, 데이터 용량이 커지면 dplyr의 속도가 느려지는 문제가 있는 듯 하다.
속도 문제를 해결하기 위해서 나온 dtplyr 패키지가 있다고 한다.
이걸 왜 이제서야 알았지??
https://henryquant.blogspot.com/2019/11/dtplyr-dplyr-datatable.html
dtplyr: dplyr의 편리함과 data.table의 속도를 그대로!
금융, 주식, 퀀트 투자에 대한 블로그입니다. 연구 결과 및 투자 결과를 정기적으로 업로드 합니다.
henryquant.blogspot.com
https://github.com/tidyverse/dtplyr/
GitHub - tidyverse/dtplyr: Data table backend for dplyr
Data table backend for dplyr. Contribute to tidyverse/dtplyr development by creating an account on GitHub.
github.com
이 패키지도 dplyr과 tidyverse를 만든 해들리 위컴이 만들었다.
해들리 위컴은 R언어의 사용성을 극적으로 끌어올린 패키지를 제작했을 뿐만 아니라, 이를 이용해서 데이터 분석을 하는 방법론을 다룬 책까지 써서 인터넷에 무료로 공개한 사람이다.
R for Data Science (2e)
Welcome This is the website for the 2nd edition of “R for Data Science”. This book will teach you how to do data science with R: You’ll learn how to get your data into R, get it into the most useful structure, transform it and visualize. In this book
r4ds.hadley.nz
세상에 이런 착한 천재가 있다니.