생활정보/파이썬 개발

Pandas 2.0 append 기능 에러 시 대처법 (concat)

뿌부부 2023. 7. 6.
반응형

Python에서 데이터 분석을 할 때 몇가지 중요한 라이브러리가 있는데, 그 중 하나가 Pandas다. 

Pandas는 데이터프레임 생성부터, 데이터 편집, 수정, 분석까지 전 과정을 편리하게 만들어주는 데이터분석 패키지다.

 

*이전발행글 - 파이썬 데이터분석 필수 라이브러리 TOP6 참고

 

 

파이썬 데이터분석 필수 라이브러리 TOP6

파이썬에는 데이터 분석 시 필요한 필수 라이브러리(패키지)가 몇 개 있다. 오늘은 파이썬 필수 라이브러리를 알아보고 각각의 특징과 기능을 소개하려고 한다. 1. Pandas 2. Numpy 3. Scipy 4. Matplotlib 5

sorbonne.tistory.com

 

Pandas 라이브러리 중 자주 사용되는 기능(function) 중 하나가 append이다. 

append는 여러 데이터프레임을 행을 기준으로 하나로 합쳐주는 기능을 한다.  

 

 

*Append function 사용 예시

import pandas as pd

# Create two dataframes
df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': ['a', 'b', 'c']})

df2 = pd.DataFrame({'A': [4, 5, 6],
                    'B': ['d', 'e', 'f']})

# Append df2 to df1
df_combined = df1.append(df2)

# Print the combined dataframe
print(df_combined)

 

결과값은 아래와 같다. 이처럼 df1, df2라는 각각의 데이터프레임을 df1.append(df2) 코드를 통해 하나로 합칠 수 있다. 

output
   A  B
0  1  a
1  2  b
2  3  c
0  4  d
1  5  e
2  6  f

 

그런데 최신 버전의 Pandas에서 이 append 기능이 작동을 하지 않는 경우가 있는데, 오늘은 그 오류와 해결책에 대해서 알아보려고 한다.

 

 

Python Pandas 라이브러리의 append 기능이 에러날 때

최근 들어 스택오버플로우에 이에 대한 비슷한 질문들이 많이 올라온다. 특히 예전 자료나 코드를 사용하고 있는 경우, 비슷한 오류에 시달리는 케이스들이 많이 있다. 이 에러의 원인은 최근에 Pandas가 2.0 버전 업데이트를 하면서 append 기능을 삭제했기 때문이다.

 

이에 대한 해결책은 concat 기능을 사용하는 것이다.

import pandas as pd

# Create two dataframes
df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': ['a', 'b', 'c']})

df2 = pd.DataFrame({'A': [4, 5, 6],
                    'B': ['d', 'e', 'f']})

# Concatenate df2 to df1
df_combined = pd.concat([df1, df2], ignore_index=True)

# Print the combined dataframe
print(df_combined)

 

첫번째 코드와 달리, 이번에는 pd.concat 을 사용하여 df1과 df2 데이터프레임을 하나로 합쳤다. 

결과값이 동일하게 나오는 것을 확인 할 수 있다.

output
   A  B
0  1  a
1  2  b
2  3  c
3  4  d
4  5  e
5  6  f

 

반응형

댓글