파이썬 두 가지 DataFrame의 다른 행 찾기 (find difference row between two dataframes by python)
2021. 9. 29. 22:35ㆍ코딩/Python
반응형
안녕하세요! 코봉이입니다.
오늘은 python을 이용하여 두 가지 DataFrame 의 다른 행을 찾는 방법을 기록해보겠습니다.
아래 그림 처럼 비슷하게 생긴 dataset이 있고, 두 dataset에서 유일하게 다른 json의 row를 찾아내 보겠습니다.
import pandas as pd
path = 'C:/Users/dataset/' ## 경로 설정 ##
data1 = pd.read_csv(path + 'data1.csv') ## data1 read ##
data2 = pd.read_csv(path + 'data2.csv') ## data2 read ##
자, 이제 두 개의 dataset 을 불러왔고, pandas의 merge 함수를 이용하여 차이가 있는 row를 찾아보겠습니다!
## data1 과 data2를 merge, indicator 가 핵심 key! ##
merge = pd.merge(data1, data2, indicator = True, how = 'outer')
data를 merge 할 때 indicator를 꼭 기입해주셔야 합니다!
merge 할 때 왼쪽에 썼던 data1가 "left" 이고, 오른쪽에 쓴 data2가 "right" 입니다.
짜잔~ 보이시나요!? json 에 해당하는 _merge 열의 값이 "right_only"로 나오면서 차이가 있는 row 를 찾아냈습니다.
해당 row만 필요한 경우에는 아래처럼 boolean을 이용하여 활용할 수 있겠죠~?
이상 오늘의 내용도 유용하게 도움이되시길 바라면서 마무리 하겠습니다.
안녕히 계세요~!
반응형
'코딩 > Python' 카테고리의 다른 글
pandas groupby output convert to DataFrame (0) | 2021.10.02 |
---|---|
groupby를 이용하여 여러 행을 하나의 행으로 요약 (multiple rows convert to single row) (0) | 2021.10.02 |
python으로 로또 1등 번호 생성하기 (동행복권) (0) | 2021.09.29 |
Python Pandas isna(), nan Row 찾기 (0) | 2021.07.26 |
python R Square 구하기 (0) | 2021.07.05 |