전체 글 30

고객 데이터를 클러스터링하고 PCA로 시각화하기

from sklearn.decomposition import PCApca = PCA(n_components=2)pca.fit(customer_clus_sc)x_pca = pca.transform(customer_clus_sc) 🎯 고객 데이터를 클러스터링하고 PCA로 시각화하기고객의 이용 패턴 데이터를 분석해 유사한 고객군(클러스터)으로 분류한 뒤, 이를 2차원으로 시각화하는 과정을 다루겠습니다.특히 PCA(주성분 분석)의 필요성과 역할에 집중해서 설명해보겠습니다. 1️⃣ 데이터 불러오기import pandas as pduselog = pd.read_csv(r'4장/use_log.csv')customer = pd.read_csv(r'4장/customer_join.csv') uselog.csv에는 고객의..

인공지능 2025.07.03

K-Means 클러스터링

🔍 K-Means 클러스터링 완전 정복: 개념부터 코드 구현까지!데이터 분석에서 "비슷한 것끼리 묶어보기"는 매우 중요한 작업입니다.이때 유용하게 쓰이는 대표적인 알고리즘이 바로 K-Means 클러스터링입니다.이번 글에서는 다음 내용을 쉽고 자세히 다뤄볼게요:클러스터링이란?K-Means 알고리즘 개념왜 스케일링이 중요한가?파이썬 코드 예제시각화 그림을 통한 직관적인 이해🧠 1. 클러스터링이란?클러스터링(Clustering)은 비슷한 데이터를 자동으로 그룹화하는 비지도 학습 기법입니다.라벨이 없는 데이터에서도 자연스러운 그룹을 찾아내고자 할 때 사용합니다.예: 헬스장 고객 데이터를 활동적인 고객/비활동적인 고객으로 자동 분류📦 2. K-Means 알고리즘이란?K-Means는 클러스터링 알고리즘 중 가..

인공지능 2025.07.03

데이터 전처리 및 집계 분석

🧹 Pandas를 활용한 고객 로그 데이터 전처리 및 집계 분석📌 1. 데이터 불러오기import pandas as pduse = pd.read_csv(r'3장/use_log.csv')master = pd.read_csv(r'3장/class_master.csv')campaign = pd.read_csv(r'3장/campaign_master.csv')customer = pd.read_csv(r'3장/customer_master.csv')use_log.csv: 고객의 사용 로그 데이터class_master.csv: 수강 클래스 정보campaign_master.csv: 캠페인 정보customer_master.csv: 고객 기본 정보📌 2. 고객 정보 병합 (class, campaign 정보 결합)cust..

인공지능 2025.07.01