컬럼 중 특정 데이터 타입을 가진 컬럼 추출하기
list(data.select_dtypes(['object']).columns)
#or
data.columns.to_series().groupby(data.dtypes).groups
범주형 데이터를 인덱스로 라벨링
from sklearn.processing import LabelEncoder
model = LabelEncoder()
model.fit(data.column_str)
data.column_int = model.transform(data.column_str)
테스트 데이터 분리
from sklearn import *
X_train, y_train, X_test, y_test
= model_selection.train_test_split(data_X, data_Y, test_size=0.1, random_state=42)
print("train :", len(X_train), len(X_test))
print("test :", len(y_train), len(y_test))
'AI > Tip!' 카테고리의 다른 글
[환경] CUDA 설치 (0) | 2022.04.17 |
---|---|
[장비] 딥러닝 환경 구축하기 : CPU 환경 (0) | 2021.11.29 |
[환경] 딥러닝 RAM 부족, 메모리 부족 (0) | 2021.03.12 |