본문 바로가기

반응형

판다스데이터프레임

(2)
Pandas Null값 관련 함수 데이터분석을 할 때 가장 방해되는 요소 중 하나가 Null값 입니다. 특히, 숫자의 계산이 필요한 경우 null값은 계산의 부정확성을 증가시킵니다. 임의로 값을 변경할 경우 정확한 분석을 할 수 없기 때문에 평균값을 입력하는 듯 합리적인 기준을 설정하여 Null 값을 변경해야합니다. 또는, 합리적인 기준에 따라 null값을 제거할 수 있습니다. 데이터프레임에서 null값을 다루는 방법을 알아보겠습니다. CSV 파일 불러오기 df = pd.read_csv('movie_scores.csv') Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요. df라고 이름을 지정하고 "movie_scores"라는 csv 파일을 불..
Pandas 활용도 높은 함수 Pandas에는 다양한 함수가 있습니다. 그중에서 활용도가 높은 함수 몇 가지를 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요. df라고 이름을 지정하고 "tips"라는 csv 파일을 불러옵니다. Transpose( ) 함수 df.describe() df.describe().transpose() transpose 함수를 이용하면 데이터의 행과 열을 바꿀 수 있습니다. Sort_values( ) 함수 df.sort_values('tip') sort_values 함수를 사용하면 특정 열을 기준으로 데이터를 정렬할 수..

반응형