본문 바로가기
ML&DATA/ML

sklearn - make_classification

by sun__ 2020. 9. 1.

<make_classification>

datascienceschool.net/view-notebook/ec26c797cec646e295d737c522733b15/

 

sklearn.datasets에 포함

 

make_classification함수는 설정에 따른 분류용 가상 데이터를 생성하는 명령이다. 

 

  • 인수:

    • n_samples : 표본 데이터의 수, 디폴트 100
    • n_features : 독립 변수의 수, 디폴트 20
    • n_informative : 독립 변수 중 종속 변수와 상관 관계가 있는 성분의 수, 디폴트 2
    • n_redundant : 독립 변수 중 다른 독립 변수의 선형 조합으로 나타나는 성분의 수, 디폴트 2
    • n_repeated : 독립 변수 중 단순 중복된 성분의 수, 디폴트 0
    • n_classes : 종속 변수의 클래스 수, 디폴트 2
    • n_clusters_per_class : 클래스 당 클러스터의 수, 디폴트 2
    • weights : 각 클래스에 할당된 표본 수
    • random_state : 난수 발생 시드
  • 반환값:

    • X : [n_samples, n_features] 크기의 배열
      • 독립 변수
    • y : [n_samples] 크기의 배열
      • 종속 변수

'ML&DATA > ML' 카테고리의 다른 글

sklearn - impute  (0) 2020.10.02
sklearn - model_selection  (0) 2020.10.02
sklearn - pipeline, compose  (0) 2020.09.01
sklearn - preprocessing  (0) 2020.08.31