<make_classification>
datascienceschool.net/view-notebook/ec26c797cec646e295d737c522733b15/
sklearn.datasets에 포함
make_classification함수는 설정에 따른 분류용 가상 데이터를 생성하는 명령이다.
-
인수:
- n_samples : 표본 데이터의 수, 디폴트 100
- n_features : 독립 변수의 수, 디폴트 20
- n_informative : 독립 변수 중 종속 변수와 상관 관계가 있는 성분의 수, 디폴트 2
- n_redundant : 독립 변수 중 다른 독립 변수의 선형 조합으로 나타나는 성분의 수, 디폴트 2
- n_repeated : 독립 변수 중 단순 중복된 성분의 수, 디폴트 0
- n_classes : 종속 변수의 클래스 수, 디폴트 2
- n_clusters_per_class : 클래스 당 클러스터의 수, 디폴트 2
- weights : 각 클래스에 할당된 표본 수
- random_state : 난수 발생 시드
-
반환값:
- X : [n_samples, n_features] 크기의 배열
- 독립 변수
- y : [n_samples] 크기의 배열
- 종속 변수
- X : [n_samples, n_features] 크기의 배열
'ML&DATA > ML' 카테고리의 다른 글
sklearn - impute (0) | 2020.10.02 |
---|---|
sklearn - model_selection (0) | 2020.10.02 |
sklearn - pipeline, compose (0) | 2020.09.01 |
sklearn - preprocessing (0) | 2020.08.31 |