wordcloud2 썸네일형 리스트형 [R] R로 하는 텍스트 전처리2 ( 동시 출현 빈도 / tf-idf/ wordcloud2) (feat. 기리보이) 1. 가사 및 사용할 패키지 불러오기 song = readLines("기리보이 9집 가사.txt", encoding = "ANSI") head(song) # 문장 별로 존재 library(dplyr) library(tidytext) library(stringr) library(KoNLP) library(widyr) # 동시 출현 빈도 계산하기 위한 패키지 ""는 빈 줄을 의미 2. 동시 출현 빈도 동시 출현 빈도란? 그룹 단위 내에서 단어가 동시에 출현한 횟수 그룹단위는 각자 정의하기 나름 여기서는 가사 한 줄 내에서 단어가 동시에 출현한 횟수를 계산할 것 동시 출현 빈도를 계산하기 앞서 텍스트 전처리가 필요하다 1) 형태소 단위로 끊어진 데이터 생성 song = song[!(song == "")] # .. 더보기 이전 1 다음