상세 컨텐츠

본문 제목

R언어 dtplyr : dplyr의 빠른 버전

R

by KimUH 2024. 5. 12. 02:52

본문

R언어는 기본 구문이 아주 번잡하고, dplyr패키지를 사용해야만 간결한 파이프 구문을 작성할 수 있다.

그런데, 데이터 용량이 커지면 dplyr의 속도가 느려지는 문제가  있는 듯 하다.

속도 문제를 해결하기 위해서 나온 dtplyr 패키지가 있다고 한다.

이걸 왜 이제서야 알았지??

 

https://henryquant.blogspot.com/2019/11/dtplyr-dplyr-datatable.html

 

dtplyr: dplyr의 편리함과 data.table의 속도를 그대로!

금융, 주식, 퀀트 투자에 대한 블로그입니다. 연구 결과 및 투자 결과를 정기적으로 업로드 합니다.

henryquant.blogspot.com

 

https://github.com/tidyverse/dtplyr/

 

GitHub - tidyverse/dtplyr: Data table backend for dplyr

Data table backend for dplyr. Contribute to tidyverse/dtplyr development by creating an account on GitHub.

github.com

 

이 패키지도 dplyr과 tidyverse를 만든 해들리 위컴이 만들었다.

해들리 위컴은 R언어의 사용성을 극적으로 끌어올린 패키지를 제작했을 뿐만 아니라, 이를 이용해서 데이터 분석을 하는 방법론을 다룬 책까지 써서 인터넷에 무료로 공개한 사람이다.

 

https://r4ds.hadley.nz/

 

R for Data Science (2e)

Welcome This is the website for the 2nd edition of “R for Data Science”. This book will teach you how to do data science with R: You’ll learn how to get your data into R, get it into the most useful structure, transform it and visualize. In this book

r4ds.hadley.nz

 

세상에 이런 착한 천재가 있다니.