전체 글 30

데이터 정리 후 출력

현재 데이터 셋 2의 고객 이름은 성 이름 기존 데이터셋은 이름이 모두 붙어 있다. 데이터셋 2를 정재해서 1과 합쳐주고 지역만 붙여주자.import pandas as pddirty_data=pd.read_csv(r'2장/uriage.csv')dirty_data2=pd.read_excel(r'2장/kokyaku_daicho.xlsx')dirty_data["purchase_date"]=pd.to_datetime(dirty_data["purchase_date"])dirty_data["purchase_month"]=dirty_data["purchase_date"].dt.strftime("%Y%m")dirty_data["item_name"]=dirty_data["item_name"].str.upper().st..

인공지능 2025.07.01

데이터 정리하기

📊 NaN값이 포함된 CSV와 Excel 파일 처리하기 – 피벗 테이블 시각화까지데이터 분석을 하다 보면 누락된 값(NaN) 이 포함된 파일을 자주 접하게 됩니다. 이 포스팅에서는 pandas를 이용해 NaN값이 있는 데이터로부터 월별 상품 매출 합계를 계산하는 피벗 테이블을 생성하는 과정을 정리해보겠습니다.✅ 1. 실습 데이터 구성2장/uriage.csv: 거래 정보 (상품명, 가격, 구매일 포함)2장/kokyaku_daicho.xlsx: 고객 명부uriage.csv에는 NaN값이 다수 포함되어 있으며, item_name이나 item_price가 누락된 경우도 존재합니다. ✅ 2. 데이터 불러오기 및 전처리import pandas as pd# CSV, Excel 데이터 불러오기dirty_data = ..

인공지능 2025.06.30

데이터 가시화

📈 pandas와 matplotlib로 월별 상품별 매출 시각화하기이전 글에서 우리는 거래 데이터를 pandas로 병합하고,상품별 월 매출을 계산하는 pivot_table까지 만들었습니다.이번 글에서는 그 결과를 matplotlib로 시각화하여월별 매출 흐름을 한눈에 확인하는 꺾은선 그래프(line chart)를 만들어보겠습니다.✅ 1단계: pivot_table로 월 × 상품별 매출 집계먼저 pivot_table을 이용해서 데이터를 표 형식으로 정리합니다.import pandas as pd# 데이터 불러오기master_read = pd.read_csv('1장\\customer_master.csv')trans1 = pd.read_csv('1장\\transaction_1.csv')trans2 = pd.re..

인공지능 2025.06.29