상세 컨텐츠

본문 제목

DataFrame에서 칼럼 선택하기

Julia

by KimUH 2025. 3. 22. 11:34

본문

DataFrame 칼럼을 선택하는 방법은 크게 2가지로 나뉜다.

- 프로퍼티 : non-copying. 편리하고 빠름. 1번에 1개의 칼럼만 선택 가능.

- 인덱싱 : copying/non-copying선택 가능. 다양한 접근법. 1번에 다수의 칼럼 선택 가능.

 

프로퍼티 액세스

- df.<칼럼명> : 기본형
- df."<칼럼명>" : 칼럼명에 공백문자(' ')가 포함되어 있거나, 적절한 변수명이 아닐 때 유용함.

내용 복사물이 필요하다면 copy(df.<칼럼명>)처럼 명시적으로 복사하면 된다.

 

인덱싱 액세스 : df[ 행_선택자 : 칼럼_선택자 ]

 

단일 칼럼 선택

- df[ : , "칼럼명_문자열"]

- df[ : , :칼럼_심볼]

- df[ : , <정수 인덱스>]

- df[ : , 칼럼명_문자열_변수]  : comprehension 표현식 사용할 때 유용함.

 

복수 칼럼 선택

- df[ : , 칼럼명_문자열_벡터]

- df[ : , 칼럼_심볼_벡터]

- df[ : , 정수_인덱스_벡터]

- df[ : , <시작_인덱스>:<종료_인덱스>]

- df[ : , 선택자로_이루어진_벡터]

- df[ : , indicator_벡터] : DataFrame 전체 칼럼 수량과 동일한 길이의 Boolean 벡터

- df[ : , r"정규_표현식"]

- df[:, Not(칼럼_선택자)] : 특정 칼럼 제외

- df[:, Between(칼럼_선택자)]

- df[ : , :], df[:, All()] : 전체 칼럼

- df[ : , Cols(선택자_인수(복수 인수 가능))]

- df[ : , Cols(Boolean반환_문자열_함수)] : 예> df[ : , startswith("P")]

 

names() 함수 사용.

names(df, 칼럼_선택자) 실행 시 해당되는 '칼럼명 문자열 벡터'를 반환하는 데, 이것이 다시 '칼럼 선택자'가 됨.

앞서 언급된 칼럼_선택자 이외에 '자료형'을 인수로 받을 수 있음.

- df[ :, names(df, Real)] : 실수형 칼럼만 선택.

- df[ :, names(df, AbstractString)] : 문자형 칼럼만 선택.

 

행 선택자에 ':' 대신 '!'을 사용하면 non-copying 접근.

 

칼럼 존재 확인 

- hasproperty("칼럼명_문자열")

- hasproperty(:칼럼_심볼)

- comlumnindex("칼럼명_문자열")

- comlumnindex(:칼럼_심볼)

 

'Julia' 카테고리의 다른 글

책 리뷰 : Julia for Data Analysis  (0) 2025.03.23
DataFrame에서 행 선택하기  (0) 2025.03.22
Julia언어 MKL 라이브러리.  (0) 2025.03.20
Julia언어 TTFP 문제  (2) 2025.03.19
Julia언어 성능 최적화 - 메모리 할당 최소화  (0) 2025.03.18

관련글 더보기