DataFrame 칼럼을 선택하는 방법은 크게 2가지로 나뉜다.
- 프로퍼티 : non-copying. 편리하고 빠름. 1번에 1개의 칼럼만 선택 가능.
- 인덱싱 : copying/non-copying선택 가능. 다양한 접근법. 1번에 다수의 칼럼 선택 가능.
프로퍼티 액세스
- df.<칼럼명> : 기본형
- df."<칼럼명>" : 칼럼명에 공백문자(' ')가 포함되어 있거나, 적절한 변수명이 아닐 때 유용함.
내용 복사물이 필요하다면 copy(df.<칼럼명>)처럼 명시적으로 복사하면 된다.
인덱싱 액세스 : df[ 행_선택자 : 칼럼_선택자 ]
단일 칼럼 선택
- df[ : , "칼럼명_문자열"]
- df[ : , :칼럼_심볼]
- df[ : , <정수 인덱스>]
- df[ : , 칼럼명_문자열_변수] : comprehension 표현식 사용할 때 유용함.
복수 칼럼 선택
- df[ : , 칼럼명_문자열_벡터]
- df[ : , 칼럼_심볼_벡터]
- df[ : , 정수_인덱스_벡터]
- df[ : , <시작_인덱스>:<종료_인덱스>]
- df[ : , 선택자로_이루어진_벡터]
- df[ : , indicator_벡터] : DataFrame 전체 칼럼 수량과 동일한 길이의 Boolean 벡터
- df[ : , r"정규_표현식"]
- df[:, Not(칼럼_선택자)] : 특정 칼럼 제외
- df[:, Between(칼럼_선택자)]
- df[ : , :], df[:, All()] : 전체 칼럼
- df[ : , Cols(선택자_인수(복수 인수 가능))]
- df[ : , Cols(Boolean반환_문자열_함수)] : 예> df[ : , startswith("P")]
names() 함수 사용.
names(df, 칼럼_선택자) 실행 시 해당되는 '칼럼명 문자열 벡터'를 반환하는 데, 이것이 다시 '칼럼 선택자'가 됨.
앞서 언급된 칼럼_선택자 이외에 '자료형'을 인수로 받을 수 있음.
- df[ :, names(df, Real)] : 실수형 칼럼만 선택.
- df[ :, names(df, AbstractString)] : 문자형 칼럼만 선택.
행 선택자에 ':' 대신 '!'을 사용하면 non-copying 접근.
칼럼 존재 확인
- hasproperty("칼럼명_문자열")
- hasproperty(:칼럼_심볼)
- comlumnindex("칼럼명_문자열")
- comlumnindex(:칼럼_심볼)
책 리뷰 : Julia for Data Analysis (0) | 2025.03.23 |
---|---|
DataFrame에서 행 선택하기 (0) | 2025.03.22 |
Julia언어 MKL 라이브러리. (0) | 2025.03.20 |
Julia언어 TTFP 문제 (2) | 2025.03.19 |
Julia언어 성능 최적화 - 메모리 할당 최소화 (0) | 2025.03.18 |