본문 바로가기
ML&DATA/data

seaborn

by sun__ 2020. 7. 30.

* heatmap

경향을 확인하는데 좋다.

 

연도별, 월별, 승객수 데이터를 읽어서 연도별로 어떤 시기에 승객이 많아지는 경향이 있는지 시각화

모든 연도를 통들어 6~8월의 승객이 가장 많음을 알 수 있다.

 

 

 

 

*pairplot

특성들간의 산포도를 보여준다. diag는 도수분포에 대한 막대그래프나 밀도그래프를 선택할 수 있다.

 

아이리스 꽃의 꽃잎의 너비와 폭, 꽃받침의 너비와 폭을 가지고 그 종을 구분하는 유명한 예시가 있다.

 

네가지 특성의 서로간의 산포도를 그려보면 다음과 같다. hue 옵션으로 범례를 추가할 수 있다.

insight를 얻기 좋은 것 같다.

 

예를 들어 setosa(파랑)은 꽃잎(petal)의 길이와 너비가 작고 꽃받침의 너비가 증가할때 꽃잎의 길이와 너비가 증가하는 경향이 다른 두 종류보다 덜하다(1차원으로 regression시 기울기가 확연히 작다)

 

 

 

'ML&DATA > data' 카테고리의 다른 글

Selenium  (0) 2020.08.12
BeautifulSoup  (0) 2020.08.08
folium  (0) 2020.07.30