티스토리 뷰

공부합시다/찍먹

[R] 텍스트마이닝

신규_유저 2021. 4. 12. 14:11
#패키지 설치

install.packages("multilinguer")
library(multilinguer)
install_jdk()
install.packages(c('stringr', 'hash', 'tau', 'Sejong', 'RSQLite', 'devtools'), type = "binary")
install.packages("remotes")
remotes::install_github('haven-jeon/KoNLP', upgrade = "never", INSTALL_opts=c("--no-multiarch"))
library(KoNLP) #최종적으로 "KoNLP" 패키지를 불러옵니다
install.packages("wordcloud")
library(wordcloud)

 

#막대그래프


txt=readLines("noh.txt")
txt=gsub("저","",txt)#저라는 글자가 있으면 블랭크처리 하라라
txt=gsub("수","",txt)
txt=gsub("들","",txt)
nouns=sapply(txt, extractNoun,USE.NAMES = F)
class(nouns)
nouns=unlist(nouns) #벡터화 시킨 다음에 이를 2글자 이상으로 선택함
nouns=Filter(function(x) {nchar(x) >= 2}, nouns)#2글자 이상만
head(unlist(nouns), 30)
write(unlist(nouns), "noh.txt")
rev=read.table("noh.txt")
nrow(rev)
rev
wordcount=table(rev)
tt=head(sort(wordcount, decreasing = T), 20)
kk=barplot(tt,ylim=c(0,30),las=2,col = rainbow(20))

#개수 표시
text(kk,tt*1.03,label=paste(tt,"개",sep=""),col=2,cex=1.5,pos=3) 

#텍스트마이닝

frame()
tt
library(wordcloud)
library(RColorBrewer)

display.brewer.all()

brewer.pal()
brewer.pal.info
palate <- brewer.pal(9, "Set1")
wordcloud(names(wordcount), # 단어
          freq = wordcount, # 단어 개수
          scale = c(5, 0.5), # 단어 크기 범위
          rot.per = 0.25, # 단어 회전 범위(전체)
          min.freq = 2, # 2글자 이상
          random.order = F, # 중앙 배치 여부
          random.colot = T, # 색상 여부
          colors = palate) # 9가지 색상

#별모양으로 만들기


install.packages("wordcloud2")
library(wordcloud2)
wordcloud2(data=wordcount,
           size=0.4,
           shape='star')

반응형
LIST

'공부합시다 > 찍먹' 카테고리의 다른 글

[R] Barplot  (0) 2021.04.13
[R] Dygraph pkg  (0) 2021.04.12
랜덤 별명 생성하기(수정 보완)  (0) 2021.04.09
랜덤 별명 생성하기  (0) 2021.04.09
[R] csv 파일 불러오기  (0) 2021.04.09
댓글
링크
공지사항
최근에 올라온 글