2025/09 5

[데이터 수집하고 분석하기] 영상 제작 및 음악 넣기

우선 영상을 간단히 만들어 보자.https://app.heygen.com/videos/1e05aeae0e3f40dca73d2a4000dc03b5 Avatar IV VideoCreate customized videos using HeyGen's AI Video Generator, turning scripts into talking videos with customizable AI avatars in minutes, without a camera or crew.app.heygen.com이번에 사용한 ai모델은 heygen이다. 무료 3개 영상을 만들 수 있으니 만들어보자.캐릭터를 넣고, 행동과 대사를 넣을 수 있다. 분석 항목 관찰된 패턴 (상위 50개 영상 기준) 시사점자모 노출 비율ㅐ, ㅔ, ㅏ 모음 비..

인공지능 2025.09.10

[데이터 수집하고 분석하기] 유튜브 api를 통해 데이터 수집 및 분석 3차

1.데이터 합치기이제 생성한 데이터를 합치고, 추출한 데이터를 바탕으로 생성형 ai를 통해 컨텐츠를 제작해보자.# patches/06_merge_audio_features.pyimport pandas as pdfrom pathlib import Path# 두 파일 읽기audio = pd.read_csv("data/processed/audio_features.csv")melody = pd.read_csv("data/processed/melody_key_features.csv")# video_id 기준 병합df = audio.merge(melody, on="video_id", how="left")# 저장Path("data/processed").mkdir(parents=True, exist_ok=True)ou..

카테고리 없음 2025.09.10

[데이터 수집하고 분석하기] 유튜브 api를 통해 데이터 수집 및 분석 2차

YouTube Data API v3CoComelon, Pinkfong, Mother Goose Club, Sesame Street, Little Baby Bum 등 채널 크롤링영상 메타데이터 (제목, 조회수, 길이, 업로드 주기)자막(SRT) → 가사·대사 텍스트 확보댓글 샘플 → 감정·주제 분석 먼저 스타터 패키지를 다운받는다.pip install -r requirements.txtcp .env.example .env# .env 열어서 YOUTUBE_API_KEY=... 값 넣기파이썬 버전 3.13이라면 아래 텍스트를 넣어주고 패치해주자 python -m src.youtube_collect --region US --channels \ "Cocomelon - Nursery Rhymes" "Pinkfon..

인공지능 2025.09.09

[데이터 수집하고 분석하기] 유튜브 api를 음원 분석 하고 생성형 ai로 생성하기 프로젝트 1차

나는 어렸을때 비디오를 많이 보았다. 울산에서 부터 서울까지 올라오며 이사를 많이 다녀서 그런지, 또래 친구들과 놀기보단 집에서 비디오 테이프를 많이 보여주셨는데, 토이스토리를 가장 많이 봤던 것 같다. 토이스토리 2 비디오가 내가 가장 좋아하는 비디오 였고 그중 버즈라이트이어 를 가장 좋아했었다.중고등학교 때에는 어린아이들이 뽀로로를 가장 좋아한다고 들었다. 오죽하면 초등학생 대통령 뽀통령이라고 까지 들었을까. 뽀로로가 옷을 입게 된 이유도 뽀로로도 옷을 안입잖아! 라는 아이의 말을 듣고 어떤 어머니가 문의를 줘서 그렇다나 뭐라나...요즘은 또 핑크퐁, 엘사, 티니핑 등등 새로운 ip들이 나타나고 있다. 넘쳐나는 데이터 속에서 다양한 데이터들이 있지만, 그중에서 어떤 데이터를 어떻게 사용하고,ai를 적..

인공지능 2025.09.09

서울시 자전거 수요 데이터(Seoul Bike Sharing) 분석 & 시각화+상관관계 분석

데이터셋: UCI - Seoul Bike Sharing Demand · 파일: SeoulBikeData.csv (약 0.58MB)목표: 기본 EDA(결측/중복/범주 분포)와 간단한 시각화(막대/원형/히스토그램/산점도)를 통해 날씨·계절 등 요소와 대여량의 관계를 직관적으로 파악한다.1) 데이터 로드import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv("SeoulBikeData.csv", encoding="cp949") # 파일 읽기 (한글 인코딩)print(df.shape) # (행, 열) → 예: (8760, 14)print(df.columns) # 컬럼명print(df.head()) # 상위 5행 미리보기2) 결..

인공지능 2025.09.03