컬럼에 조건 부여하기
일단 어떠한 조건식을 생성하였을 때, 조건식 그 자체는 해당 열의 데이터와 일치하지 않는지를 boolean값으로 구분한 데이터를 가지고 있다.
이것은 다시 원래의 Dataframe객체에 집어넣는 것으로, 추출해낼 수 있다.
특정 컬럼에서 특정값만 뽑아내기
예를들어서, 전체 영화목록 중에서, 스튜디오가 유니버셜인 영화만 찾아내고 싶을 때.
movies[movies["Studio"] == "Universal"]
이것을 별도의 변수로 뽑아내어 사용할 수도 있다.
a = movies["Studio"] == "Universal"
movies[a]
AND 조건
두 개 이상의 조건에 만족하는 데이터를 찾고 싶을 때.
영화제작사가 유니버셜이면서, 제작연도가 2015인 영화 목록만을 찾는다고 한다면,
a = movies["Studio"] == "Universal"
b = movies["Year"] == 2015
movies[a&b]
&
하나로 묶어준다.
OR 조건
|
하나로 묶어주면 된다.
범위 지정
1995년 전에 개봉한 영화를 찾는다고 할 때,
a = movies["Year"] < 1975
movies[a]
혹은 a와 b 사이를 찾는다고 할때는, between()
을 사용한다.
a = movies["Year"].between(1995, 2000)
movies[a]
특정 문자열이 들어간 데이터를 찾을 때는?
인덱스에서 찾는다고 하면, 아래처럼 인덱스를 문자열로 바꾸고, 모든 문자를 소문자(혹은 대문자) 로 치환한 다음, 찾아볼 수도 있다.
a = movies.index.str.lower().str.contains("dark")
movies[a]
반응형
'Pandas 공부해보기' 카테고리의 다른 글
Pandas 2. Series object - 2 통계와 산술연산 (0) | 2022.10.01 |
---|---|
Pandas 2. Series object - 1 (0) | 2022.10.01 |
Pandas 1. 기본 메소드 - 컬럼의 갯수 세기 value_count (0) | 2022.09.25 |
Pandas 1. 기본 메소드 - Dataframe의 각종 크기와 컬럼의 속성 확인하기 (0) | 2022.09.25 |
Pandas 1. 기본 메소드 - iloc과 loc (0) | 2022.09.25 |
댓글