본문 바로가기

반응형

데이터 분석

(15)
Pandas DataFrames 기본 Indexing (Rows) 파이썬을 사용하여 데이터를 불러오고 기본 Indexing을 활용하여 필요한 데이터를 추출하는 방법에 대해 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요. df라고 이름을 지정하고 "tips"라는 csv 파일을 불러옵니다. 행 (Raw) Index 설정 df.set_index('Payment ID') df = df.reset_index() df.head() set_index 함수를 사용하여 Payment ID를 인덱스로 지정합니다. head 함수를 활용하여 순서 상 상단 5개의 행 데이터를 가져옵니다. 특정 행 (..
Pandas DataFrames 기본 Indexing (Columns) 파이썬을 사용하여 데이터를 불러오고 기본 Indexing을 활용하여 필요한 데이터를 추출하는 방법에 대해 알아보도록 하겠습니다. CSV 파일 불러오기 df = pd.read_csv('tips.csv') Jupyter Notebook을 사용하는 경우, 불러오고자 하는 CSV 파일이 Jupyter Notebook 파일과 같은 폴더에 있도록 해주세요. df라고 이름을 지정하고 "tips"라는 csv 파일을 불러옵니다. 열 (Columns) 항목 확인 df.columns Index(['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size', 'price_per_person', 'Payer Name', 'CC Number', 'Payment ID'], dtype=..
MySQL로 온라인 스토어 광고 성과 분석 안녕하세요, 더스퍼드입니다. MySQL을 실무에서 어떻게 사용할 수 있을지 온라인 스토어를 예시로 예상 문제를 풀어보도록 하겠습니다. 특정 소스의 광고 성과 분석 아래 온라인 스토어 데이터 스키마가 있습니다. nonbrand 캠페인 gsearch 소스의 광고 예산을 2012년 4월 15일부터 줄였습니다. 예산을 줄인 후 nonbrand 캠페인 gsearch 소스의 광고 성과를 분석하겠습니다. 아래 해당 데이터 스키마를 기준으로 작성한 쿼리가 있습니다. 쿼리를 하나씩 이해해 보도록 하겠습니다. 1. FROM 날짜 (created_at)와 방문자 수 (website_session_id) 데이터가 필요하기 때문에 website_sessions 테이블에서 데이터를 참조합니다. 2. WHERE nonbrand 캠..
MySQL로 온라인 스토어 트래픽 전환율 확인하기 안녕하세요, 더스퍼드입니다. MySQL을 실무에서 어떻게 사용할 수 있을지 온라인 스토어를 예시로 예상 문제를 풀어보도록 하겠습니다. 특정 소스의 트래픽 전환율 (Conversion Rate) 구하기 아래 온라인 스토어 데이터 스키마가 있습니다. 해당 데이터 스키마를 기준으로 nonbrand 캠페인의 gsearch 소스 전환율을 알아보도록 하겠습니다. 아래 해당 데이터 스키마를 기준으로 작성한 쿼리가 있습니다. 쿼리를 하나씩 이해해 보도록 하겠습니다. 1. FROM 전환율을 구하려면 구매가 발생한 횟수와 방문자 수에 대한 데이터가 필요합니다. 따라서, website_sessions 테이블과 orders 테이블을 연결하여 필요한 데이터를 조회해야 합니다. 두 테이블 모두에 공통된 데이터 항목인 websit..
MySQL로 온라인 스토어 방문자 수 확인하기 안녕하세요, 더스퍼드입니다. MySQL을 실무에서 어떻게 사용할 수 있을지 온라인 스토어를 예시로 예상 문제를 풀어보도록 하겠습니다. 방문자 수가 가장 많은 소스 구하기 아래 온라인 스토어 데이터 스키마가 있습니다. 해당 데이터 스키마를 기준으로 방문자가 가장 많은 소스를 찾아보도록 하겠습니다. 아래 해당 데이터 스키마를 기준으로 작성한 쿼리가 있습니다. 쿼리를 하나씩 이해해 보도록 하겠습니다. 1. FROM 해당 데이터 스키마를 보면 website_session_id를 사용하여 방문자 수를 구할 수 있을 것 같습니다. Session ID는 방문자의 ID입니다. website_session_id와 소스 종류 데이터 (utm_source)가 있는 website_sessions 테이블을 참조합니다. 2. W..

반응형