2025/06 5

데이터 정리하기

📊 NaN값이 포함된 CSV와 Excel 파일 처리하기 – 피벗 테이블 시각화까지데이터 분석을 하다 보면 누락된 값(NaN) 이 포함된 파일을 자주 접하게 됩니다. 이 포스팅에서는 pandas를 이용해 NaN값이 있는 데이터로부터 월별 상품 매출 합계를 계산하는 피벗 테이블을 생성하는 과정을 정리해보겠습니다.✅ 1. 실습 데이터 구성2장/uriage.csv: 거래 정보 (상품명, 가격, 구매일 포함)2장/kokyaku_daicho.xlsx: 고객 명부uriage.csv에는 NaN값이 다수 포함되어 있으며, item_name이나 item_price가 누락된 경우도 존재합니다. ✅ 2. 데이터 불러오기 및 전처리import pandas as pd# CSV, Excel 데이터 불러오기dirty_data = ..

인공지능 2025.06.30

데이터 가시화

📈 pandas와 matplotlib로 월별 상품별 매출 시각화하기이전 글에서 우리는 거래 데이터를 pandas로 병합하고,상품별 월 매출을 계산하는 pivot_table까지 만들었습니다.이번 글에서는 그 결과를 matplotlib로 시각화하여월별 매출 흐름을 한눈에 확인하는 꺾은선 그래프(line chart)를 만들어보겠습니다.✅ 1단계: pivot_table로 월 × 상품별 매출 집계먼저 pivot_table을 이용해서 데이터를 표 형식으로 정리합니다.import pandas as pd# 데이터 불러오기master_read = pd.read_csv('1장\\customer_master.csv')trans1 = pd.read_csv('1장\\transaction_1.csv')trans2 = pd.re..

인공지능 2025.06.29

데이터 분석을 위한 파이썬2

print( join_data.groupby(["payment_month", "item_name"])[["quantity", "total_price"]].sum())🧮 pandas로 거래 데이터 분석 시작하기 – 데이터 읽기부터 검산까지 (실습 중심)이번 글에서는 pandas를 활용하여 실제 거래 데이터를 기반으로 한 분석 흐름을 정리해봤습니다.실습 중심으로 구성했으며, 데이터 읽기 → 병합 → 가공 → 검산까지 단계별로 다뤘습니다.📌 사용 데이터:customer_master.csvtransaction_1.csv, transaction_2.csvtransaction_detail_1.csvitem_master.csv1️⃣ 데이터 불러오기먼저 각 CSV 파일을 불러옵니다. read_csv()는 기본..

인공지능 2025.06.29

데이터 분석을 위한 파이썬

🐼 Pandas로 시작하는 데이터 분석 – 데이터 읽기, 결합, 병합 기초편이번 포스팅에서는 pandas를 활용해 CSV 파일 읽기부터 데이터 결합, 병합(Merge) 까지의 기초적인 흐름을 다뤄봅니다.초보자도 따라 할 수 있도록 실제 예제와 함께 단계별로 구성했습니다.1️⃣ 데이터 읽기가장 먼저 해야 할 일은 데이터를 pandas의 read_csv() 함수를 이용해 불러오는 것입니다.import pandas as pd# 고객 마스터 정보master_read = pd.read_csv('1장\\customer_master.csv')# 거래 데이터 1, 2trans1 = pd.read_csv('1장\\transaction_1.csv')trans2 = pd.read_csv('1장\\transaction_2...

인공지능 2025.06.29

numpy 에서의 기본 문법

2차원 배열과 reshape()2차원 배열은 1차원 배열 제작 → reshape()를 통한 변경 으로 쉽게 만들 수 있다. 또는 np.array([[...],[...]]) 형태로 직접 만들 수도 있다.import numpy as nparray1=np.arange(10)array2=array1.reshape(2,5)#또는 array3=array1.reshape(-1,5) #여기서 -1은 자동계산으로 하나만 정해져 있다면 배열 을 2차원에 맞게 자동 졷정print(array2,array3) sort() 와 argsort()기본 문법에서 sort와 sorted처럼 sort()는 배열을 오름차순 기본으로 반환값 None을 가지고 있다.(새 함수를 만들어 저장해야한다)내림차순을 하고 싶다면 함수명.sort()[:..