* heatmap
경향을 확인하는데 좋다.
연도별, 월별, 승객수 데이터를 읽어서 연도별로 어떤 시기에 승객이 많아지는 경향이 있는지 시각화
모든 연도를 통들어 6~8월의 승객이 가장 많음을 알 수 있다.
*pairplot
특성들간의 산포도를 보여준다. diag는 도수분포에 대한 막대그래프나 밀도그래프를 선택할 수 있다.
아이리스 꽃의 꽃잎의 너비와 폭, 꽃받침의 너비와 폭을 가지고 그 종을 구분하는 유명한 예시가 있다.
네가지 특성의 서로간의 산포도를 그려보면 다음과 같다. hue 옵션으로 범례를 추가할 수 있다.
insight를 얻기 좋은 것 같다.
예를 들어 setosa(파랑)은 꽃잎(petal)의 길이와 너비가 작고 꽃받침의 너비가 증가할때 꽃잎의 길이와 너비가 증가하는 경향이 다른 두 종류보다 덜하다(1차원으로 regression시 기울기가 확연히 작다)
'ML&DATA > data' 카테고리의 다른 글
Selenium (0) | 2020.08.12 |
---|---|
BeautifulSoup (0) | 2020.08.08 |
folium (0) | 2020.07.30 |