본문 바로가기

데이터 분석

Pandas Apply 함수 (1)

반응형

Pandas Apply 함수

 

 

Pandas 함수 중 Apply 함수를 사용하면 새롭게 계산된 데이터 또는 조건에 따른 데이터를 가진 열을 쉽게 추가할 수 있습니다. 

 

 

 
 

CSV 파일 불러오기

 

 

df = pd.read_csv('tips.csv')

 

 

Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요.

df라고 이름을 지정하고 "tips"라는 csv 파일을 불러옵니다.

 

 

 
 

Apply( ) 함수를 사용한 Column 추가 (1)

 

 

def last_four(num):
    return str(num)[-4:]

 

 

def 함수를 사용하여 커스텀 함수를 만듭니다. 위의 예시 코드는 "last_four"라는 함수를 만들고 해당 함수에 문자 데이터를 입력하면 입력한 문자 데이터의 마지막 4개의 문자를 출력한다는 의미입니다. 

 

 

df.head()

 

 

 

 

불러온 데이터의 마지막 열은 "Payment ID"입니다. 위에서 만든 커스텀 함수를 활용하여 열을 추가해 보겠습니다. 

 

 

df['last_four'] = df['CC Number'].apply(last_four)

 

 

df.head()

 

 

 

 

df['CC Number'].apply(last_four)는 기존에 있던 "CC Number"라는 열에 있는 데이터를 새로 만든 함수에 적용한다는 의미입니다. df['last_four'] = df['CC Number'].apply(last_four)는 "last_four"라는 이름의 열을 불러온 데이터에 추가하며 각 행의 데이터 값은 "CC Number"의 마지막 4개의 문자 값입니다.     

 

 

불러온 데이터프레임에 새로운 열을 추가하는 방법은 이전 글을 참조해 주세요. 

 

 

 

Pandas DataFrames 기본 Indexing (Columns)

파이썬을 사용하여 데이터를 불러오고 기본 Indexing을 활용하여 필요한 데이터를 추출하는 방법에 대해 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는

thespud.kr

 

 

 
 

Apply( ) 함수를 사용한 Column 추가 (2)

 

 

이번에는 조금 더 복잡한 커스텀 함수를 만들어보겠습니다. 

 

 

def yelp(price):
    if price < 10:
        return '$'
    elif price >= 10 and price < 30:
        return '$$'
    else:
        return '$$$'

 

 

"yelp"라는 커스텀 함수는 10 보다 적은 가격이 입력되면 "$," 10 이상이고 30보다 적은 가격이 입력되면 "$$," 그리고 이외의 가격이 입력되면 "$$$"을 출력합니다. 

 

 

df['Expensive'] = df['total_bill'].apply(yelp)

 

 

df.head()

 

 

 

 

df['total_bill'].apply(yelp)는 기존에 있던 "total_bill"이라는 열에 있는 데이터를 새로 만든 함수에 적용한다는 의미입니다. df['Expensive'] = df['total_bill'].apply(yelp)는 "Expensive"라는 이름의 열을 불러온 데이터에 추가하며 각 행의 데이터 값은  각 조건에 따른 "$" 표시입니다. 예를 들어, 첫 행의 total_bill 값은 16.99 이기 때문에 "$$"가 출력됐습니다.      

 

 

 


 

 

 

 

Pandas 조건 필터링

파이썬을 사용하여 데이터를 불러오고 조건을 설정하여 데이터를 필터링하는 방법을 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는 경우, 불러오고자

thespud.kr

 

 

Pandas DataFrames 기본 Indexing (Rows)

파이썬을 사용하여 데이터를 불러오고 기본 Indexing을 활용하여 필요한 데이터를 추출하는 방법에 대해 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는

thespud.kr

 

반응형

'데이터 분석' 카테고리의 다른 글

Pandas 활용도 높은 함수  (0) 2024.01.14
Pandas Apply 함수 (2)  (0) 2024.01.13
Pandas 조건 필터링  (2) 2024.01.12
Pandas DataFrames 기본 Indexing (Rows)  (0) 2024.01.08
Pandas DataFrames 기본 Indexing (Columns)  (0) 2024.01.08