Python에서 데이터 분석을 할 때 몇가지 중요한 라이브러리가 있는데, 그 중 하나가 Pandas다.
Pandas는 데이터프레임 생성부터, 데이터 편집, 수정, 분석까지 전 과정을 편리하게 만들어주는 데이터분석 패키지다.
*이전발행글 - 파이썬 데이터분석 필수 라이브러리 TOP6 참고
파이썬 데이터분석 필수 라이브러리 TOP6
파이썬에는 데이터 분석 시 필요한 필수 라이브러리(패키지)가 몇 개 있다. 오늘은 파이썬 필수 라이브러리를 알아보고 각각의 특징과 기능을 소개하려고 한다. 1. Pandas 2. Numpy 3. Scipy 4. Matplotlib 5...
sorbonne.tistory.com
Pandas 라이브러리 중 자주 사용되는 기능(function) 중 하나가 append이다.
append는 여러 데이터프레임을 행을 기준으로 하나로 합쳐주는 기능을 한다.
*Append function 사용 예시
import pandas as pd
# Create two dataframes
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [4, 5, 6],
'B': ['d', 'e', 'f']})
# Append df2 to df1
df_combined = df1.append(df2)
# Print the combined dataframe
print(df_combined)
결과값은 아래와 같다. 이처럼 df1, df2라는 각각의 데이터프레임을 df1.append(df2) 코드를 통해 하나로 합칠 수 있다.
output
A B
0 1 a
1 2 b
2 3 c
0 4 d
1 5 e
2 6 f
그런데 최신 버전의 Pandas에서 이 append 기능이 작동을 하지 않는 경우가 있는데, 오늘은 그 오류와 해결책에 대해서 알아보려고 한다.
Python Pandas 라이브러리의 append 기능이 에러날 때
최근 들어 스택오버플로우에 이에 대한 비슷한 질문들이 많이 올라온다. 특히 예전 자료나 코드를 사용하고 있는 경우, 비슷한 오류에 시달리는 케이스들이 많이 있다. 이 에러의 원인은 최근에 Pandas가 2.0 버전 업데이트를 하면서 append 기능을 삭제했기 때문이다.
이에 대한 해결책은 concat 기능을 사용하는 것이다.
import pandas as pd
# Create two dataframes
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [4, 5, 6],
'B': ['d', 'e', 'f']})
# Concatenate df2 to df1
df_combined = pd.concat([df1, df2], ignore_index=True)
# Print the combined dataframe
print(df_combined)
첫번째 코드와 달리, 이번에는 pd.concat 을 사용하여 df1과 df2 데이터프레임을 하나로 합쳤다.
결과값이 동일하게 나오는 것을 확인 할 수 있다.
output
A B
0 1 a
1 2 b
2 3 c
3 4 d
4 5 e
5 6 f
'생활정보 > 파이썬 개발' 카테고리의 다른 글
파이썬 데이터분석 필수 라이브러리 TOP6 (0) | 2023.07.05 |
---|---|
파이썬(Python) 가상환경 만들기 (패키지 충돌에러 예방) (0) | 2023.07.04 |
아나콘다에서 Jupyter lab / Jupyter Notebook 안 열리는 에러 (0) | 2023.07.02 |
맥에서 아나콘다(Anaconda) 설치하기 (0) | 2023.07.02 |
맥북 파이썬 버전 확인 + 업데이트 + 업데이트 에러 (1) | 2023.06.30 |
댓글