티스토리 뷰

1. 데이터 구조의 앞부분 확인하기

head(iris)

첫 번째 전달인자로 처음 확인할 자료의 이름을전달받아 각각 여섯 개의 자료를 출력함.

 

2. 개수 출력하기

table(iris$Species)

개수를 확인하는 방법으로 table 사용

 

 

3. 데이터 차원 확인하기

dim(iris)

차원 개수를 확인하는 방법으로 dim()함수를 사용함.

배열이라면 행과 열, 차원까지 출력함.

4. 데이터를 학습용 데이터와 평가용 데이터로 분할하기

iris_train=iris[1:105,]
iris_test=iris[106:150,]
iris_train

iris_train=iris[1:105,] : 데이터의 첫 행부터 105행까지 학습용으로 할당

iris_test=iris[106:150,] : 데이터의 106행부터 마지막 행까지 평가용으로 할당

 

5. 무작위 샘플 추출하기

idx=sample(1:nrow(iris),size = nrow(iris)*0.7,replace = F)

idx

iris_train=iris[idx,]
iris_test=iris[-idx,]
iris_train

table(iris$Species)
table(iris_train$Species)
table(iris_test$Species)


caret 패캐지 이용하기

예측모델을 만들기 위한 데이터 학습 시 간편한 함수를 제공해 준다

 

1. caret 패키지 설치

install.packages('caret')

 

2. caret 패캐지를 R에 로드시키기

library(caret)

 

3. createDataPartition 함수를 사용하여 학습용 데이터로 할당할 인덱스 추출

train_idx=createDataPartition(iris$Species,p=0.7,list = F)
iris_train=iris[train_idx,]
iris_test=iris[-train_idx,]

 

반응형
LIST
댓글
링크
공지사항
최근에 올라온 글