[R] 데이터 세트 분할하기

신규_유저 2021. 6. 14. 11:24

2021. 6. 14. 11:24

head(iris)

첫 번째 전달인자로 처음 확인할 자료의 이름을전달받아 각각 여섯 개의 자료를 출력함.

table(iris$Species)

개수를 확인하는 방법으로 table 사용

dim(iris)

차원 개수를 확인하는 방법으로 dim()함수를 사용함.

배열이라면 행과 열, 차원까지 출력함.

iris_train=iris[1:105,]
iris_test=iris[106:150,]
iris_train

iris_train=iris[1:105,] : 데이터의 첫 행부터 105행까지 학습용으로 할당

iris_test=iris[106:150,] : 데이터의 106행부터 마지막 행까지 평가용으로 할당

idx=sample(1:nrow(iris),size = nrow(iris)*0.7,replace = F)

idx

iris_train=iris[idx,]
iris_test=iris[-idx,]
iris_train

table(iris$Species)
table(iris_train$Species)
table(iris_test$Species)

caret 패캐지 이용하기

예측모델을 만들기 위한 데이터 학습 시 간편한 함수를 제공해 준다

install.packages('caret')

library(caret)

train_idx=createDataPartition(iris$Species,p=0.7,list = F)
iris_train=iris[train_idx,]
iris_test=iris[-train_idx,]

[R] 수치 예측 목적의 러신머닝 (0)	2021.06.15
[R] 분류 목적 머신러닝 (0)	2021.06.14
포트 변경하기 (0)	2021.05.19
사용자 생성하기 (0)	2021.05.19
[errors]Listener refused the connection with the following error (0)	2021.05.19