sklearn - make_classification

<make_classification>

sklearn.datasets에 포함

make_classification함수는 설정에 따른 분류용 가상 데이터를 생성하는 명령이다.

인수:
- n_samples : 표본 데이터의 수, 디폴트 100
- n_features : 독립 변수의 수, 디폴트 20
- n_informative : 독립 변수 중 종속 변수와 상관 관계가 있는 성분의 수, 디폴트 2
- n_redundant : 독립 변수 중 다른 독립 변수의 선형 조합으로 나타나는 성분의 수, 디폴트 2
- n_repeated : 독립 변수 중 단순 중복된 성분의 수, 디폴트 0
- n_classes : 종속 변수의 클래스 수, 디폴트 2
- n_clusters_per_class : 클래스 당 클러스터의 수, 디폴트 2
- weights : 각 클래스에 할당된 표본 수
- random_state : 난수 발생 시드
반환값:
- X : [n_samples, n_features] 크기의 배열
  - 독립 변수
- y : [n_samples] 크기의 배열
  - 종속 변수

CS