본문 바로가기

ML&DATA53

4 - 선형 회귀 (정규방정식) www.youtube.com/watch?v=6omvN1nuZMc&list=PLJN246lAkhQjX3LOdLVnfdFaCbGouEBeb&index=13 박해선 교수님의 유튜브 강의로 공부했음을 밝힙니다. 선형 회귀 모델을 훈련시키는 두 가지 방법 정규방정식 경사하강법 GD(배치, 미니배치, 확률적(stochastic)) 정규방정식 sklearn.linear_model의 LinearRegression에 해당함. from sklearn.linear_model import LinearRegression lin_reg = LinearRegression() lin_reg.fit(X,y) lin_reg.intercept_, lin_reg.coef_ #bias와 weight #(array([4.41766218]), .. 2020. 9. 4.
sklearn - pipeline, compose blog.naver.com/gdpresent/221730873049 참고 파이프 라인(Pipe Line) [내가 공부한 머신러닝 #28.] GridSearchCV도 사용법을 이제 아니깐 드디어 pipe line에 대한 것을 고려해볼때가 왔다.바로 전에 그... blog.naver.com 1. sklearn.pipeline fit, transform 메서드가 있는 변환기를 순서를 고려해서 묶어둔 것 from sklearn.pipeline import Pipeline from sklearn.preprocessing import StandardScaler num_pipeline = Pipeline([ ('imputer', SimpleImputer(strategy='median')), ('attribs_adde.. 2020. 9. 1.
sklearn - make_classification datascienceschool.net/view-notebook/ec26c797cec646e295d737c522733b15/ sklearn.datasets에 포함 make_classification함수는 설정에 따른 분류용 가상 데이터를 생성하는 명령이다. 인수: n_samples : 표본 데이터의 수, 디폴트 100 n_features : 독립 변수의 수, 디폴트 20 n_informative : 독립 변수 중 종속 변수와 상관 관계가 있는 성분의 수, 디폴트 2 n_redundant : 독립 변수 중 다른 독립 변수의 선형 조합으로 나타나는 성분의 수, 디폴트 2 n_repeated : 독립 변수 중 단순 중복된 성분의 수, 디폴트 0 n_classes : 종속 변수의 클래스 수, 디폴트 2 n_cl.. 2020. 9. 1.
sklearn - preprocessing 1. Scaling StandardScaler() : 평균이 0, 표준편차가 1이 되도록 정규화 RobustScaler(): 중강값이 0, IQR(interquartile range)이 1이 되도록 스케일링 MinMaxScaler() : 최대값이 1, 최소값이 0이 되도록 스케일링 MaxAbsScaler() : 0을 기준으로 절대값이 가장 큰 수가 1 또는 -1이 되도록 스케일링 fit: 분포 모수를 객체 내에 저장 transform: 학습용 데이터를 입력하여 저장된 분포 모수를 이용해서 데이터를 스케일링 fit_transform: fit-transform을 합쳐서 한번에 이용 from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() .. 2020. 8. 31.