본문 바로가기
Pandas 공부해보기

Pandas 1. 기본 메소드 - 컬럼에 조건식 부여하기

by 유티끌 2022. 9. 25.

컬럼에 조건 부여하기

일단 어떠한 조건식을 생성하였을 때, 조건식 그 자체는 해당 열의 데이터와 일치하지 않는지를 boolean값으로 구분한 데이터를 가지고 있다.
이것은 다시 원래의 Dataframe객체에 집어넣는 것으로, 추출해낼 수 있다.

 

특정 컬럼에서 특정값만 뽑아내기

예를들어서, 전체 영화목록 중에서, 스튜디오가 유니버셜인 영화만 찾아내고 싶을 때.

movies[movies["Studio"] == "Universal"]

이것을 별도의 변수로 뽑아내어 사용할 수도 있다.

a = movies["Studio"] == "Universal"
movies[a]

AND 조건

두 개 이상의 조건에 만족하는 데이터를 찾고 싶을 때.
영화제작사가 유니버셜이면서, 제작연도가 2015인 영화 목록만을 찾는다고 한다면,

a = movies["Studio"] == "Universal"
b = movies["Year"] == 2015
movies[a&b]

& 하나로 묶어준다.

OR 조건

| 하나로 묶어주면 된다.

범위 지정

1995년 전에 개봉한 영화를 찾는다고 할 때,

a = movies["Year"] < 1975
movies[a]

혹은 a와 b 사이를 찾는다고 할때는, between() 을 사용한다.

a = movies["Year"].between(1995, 2000)
movies[a]

특정 문자열이 들어간 데이터를 찾을 때는?

인덱스에서 찾는다고 하면, 아래처럼 인덱스를 문자열로 바꾸고, 모든 문자를 소문자(혹은 대문자) 로 치환한 다음, 찾아볼 수도 있다.

a = movies.index.str.lower().str.contains("dark")
movies[a]
반응형

댓글