본문 바로가기

반응형

판다스데이터분석

(4)
파이썬 판다스 실무 데이터 분석 (1) 파이썬 판다스를 사용하면 현재 가진 데이터에서 빠르게 원하는 정보를 얻을 수 있습니다. 마케팅과 같이 데이터에 대한 전문성이 높지 않지만 데이터를 활용할 수 있는 분야에서 판다스 활용 능력은 업무에 많은 도움이 됩니다. 이번 시간에는 판다스를 활용하여 다양한 실무 데이터 분석을 해보도록 하겠습니다. 데이터 불러오기 import pandas as pd hotels = pd.read_csv("hotel_booking_data.csv") 파이썬에서 판다스 라이브러리를 불러오고 'hotel_booking_data' 데이터를 가져옵니다. 데이터 파일은 'hotels'라는 별칭을 지정합니다. hotels.head() head 함수를 사용하여 대략적인 데이터 구성을 보면 총 36개의 열을 확인할 수 있습니다. hot..
판다스 데이터프레임 합치기 (concat, merge) 데이터 분석을 하다 보면 다른 데이터프레임을 서로 합쳐야 하는 경우가 있는데요, 판다스로 다른 데이터프레임을 합치는 방법에 대하여 알아보도록 하겠습니다. 출발합니다! 데이터 준비 1 data_one = {'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3']} data_two = {'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']} one = pd.DataFrame(data_one) two = pd.DataFrame(data_two) 먼저 임의로 데이터프레임 두 개 (one과 two)를 만들어 줍니다. one two Concat ( ): 행을 기준으로 합치기 A = pd.concat([one,t..
Pandas 활용도 높은 함수 Pandas에는 다양한 함수가 있습니다. 그중에서 활용도가 높은 함수 몇 가지를 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요. df라고 이름을 지정하고 "tips"라는 csv 파일을 불러옵니다. Transpose( ) 함수 df.describe() df.describe().transpose() transpose 함수를 이용하면 데이터의 행과 열을 바꿀 수 있습니다. Sort_values( ) 함수 df.sort_values('tip') sort_values 함수를 사용하면 특정 열을 기준으로 데이터를 정렬할 수..
Pandas Apply 함수 (1) Pandas 함수 중 Apply 함수를 사용하면 새롭게 계산된 데이터 또는 조건에 따른 데이터를 가진 열을 쉽게 추가할 수 있습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요. df라고 이름을 지정하고 "tips"라는 csv 파일을 불러옵니다. Apply( ) 함수를 사용한 Column 추가 (1) def last_four(num): return str(num)[-4:] def 함수를 사용하여 커스텀 함수를 만듭니다. 위의 예시 코드는 "last_four"라는 함수를 만들고 해당 함수에 문자 데이터를 입력하면 입력한 문자 데이터의..

반응형