머신러닝을 처음 접할 때 가장 많이 사용하는 예제가 바로 Iris 데이터다. 이 데이터는 붓꽃의 꽃잎과 꽃받침의 길이·너비를 보고 어떤 품종인지 분류하는 문제다. 이번 글에서는 이 데이터를 이용해 의사결정나무 모델을 학습하고, 예측하고, 그래프 시각화까지 진행한다.1. Iris 데이터란?Iris 데이터는 총 150개의 샘플로 구성되어 있고, 각 샘플에는 다음 네 가지 특성이 있다.꽃받침 길이 (sepal length)꽃받침 너비 (sepal width)꽃잎 길이 (petal length)꽃잎 너비 (petal width)그리고 각 샘플은 세 가지 품종 중 하나에 속한다.setosaversicolorvirginica즉, 4개의 숫자로 이루어진 특성을 보고 어떤 품종인지 맞추는 것이 목표다.2. 데이터 불러..