티스토리 뷰
1. 데이터 구조의 앞부분 확인하기
head(iris)
첫 번째 전달인자로 처음 확인할 자료의 이름을전달받아 각각 여섯 개의 자료를 출력함.
2. 개수 출력하기
table(iris$Species)
개수를 확인하는 방법으로 table 사용
3. 데이터 차원 확인하기
dim(iris)
차원 개수를 확인하는 방법으로 dim()함수를 사용함.
배열이라면 행과 열, 차원까지 출력함.
4. 데이터를 학습용 데이터와 평가용 데이터로 분할하기
iris_train=iris[1:105,]
iris_test=iris[106:150,]
iris_train
iris_train=iris[1:105,] : 데이터의 첫 행부터 105행까지 학습용으로 할당
iris_test=iris[106:150,] : 데이터의 106행부터 마지막 행까지 평가용으로 할당
5. 무작위 샘플 추출하기
idx=sample(1:nrow(iris),size = nrow(iris)*0.7,replace = F)
idx
iris_train=iris[idx,]
iris_test=iris[-idx,]
iris_train
table(iris$Species)
table(iris_train$Species)
table(iris_test$Species)
caret 패캐지 이용하기
예측모델을 만들기 위한 데이터 학습 시 간편한 함수를 제공해 준다
1. caret 패키지 설치
install.packages('caret')
2. caret 패캐지를 R에 로드시키기
library(caret)
3. createDataPartition 함수를 사용하여 학습용 데이터로 할당할 인덱스 추출
train_idx=createDataPartition(iris$Species,p=0.7,list = F)
iris_train=iris[train_idx,]
iris_test=iris[-train_idx,]
반응형
LIST
'공부합시다 > 찍먹' 카테고리의 다른 글
[R] 수치 예측 목적의 러신머닝 (0) | 2021.06.15 |
---|---|
[R] 분류 목적 머신러닝 (0) | 2021.06.14 |
포트 변경하기 (0) | 2021.05.19 |
사용자 생성하기 (0) | 2021.05.19 |
[errors]Listener refused the connection with the following error (0) | 2021.05.19 |
댓글