-
Notifications
You must be signed in to change notification settings - Fork 429
Description
안녕하세요, 저자님.
저자님의 교재를 통해 R언어를 공부 중인 한 학생입니다. 다름이 아니라 텍스트 마이닝 챕터 학습 중 여러 문제점과 의문점이 생겨
질문을 남깁니다.
먼저, pg.265를 보면 KoNLP 패키지 사용을 위해 자바 설치가 필요하다고 하는데 책에는 install.packages를 통해 R스튜디오 내에서 자체적으로 자바 설치를 통해 바로 KoNLP 패키지 설치 및 사용이 가능한 것으로 나와 있습니다.
그러나 실제로 시도해본 결과 이는 불가능했고, 이에 깃허브에 방문하여 저자님이 올려주신 아래 링크를 통해 자바를 설치한 후에야 정상적으로 작동되었습니다.
https://github.com/youngwoos/Doit_R/blob/master/FAQ/install_KoNLP.md
제가 이해한 것처럼 자바를 직접 다운로드해야 정상적인 이용이 가능한 것인지 묻고 싶습니다. 이와 더불어 위 링크에 4번인 < scala-library-2.11.8.jar파일 다운로드하기> 과정이 텍스트 마이닝에 필수적인지, 이 파일이 어떤 기능을 하는지 알고 싶습니다. 교재에는 이 내용이 없기 때문입니다.
이와 더불어 교재 pg.274를 보면 df_word <- as.data.frame(wordcount) 이후 두 글자 이상 단어 추출을 위해 filter와 nchar 함수를 이용하는 부분에서 교재와 동일하게 작성하였는데도 정상적인 작동이 되지 않아서 추가적인 질문을 드리고 싶습니다.
교재에 나와있는 대로 작성을 할 경우 nchar 함수가 오류와 함께 정상적으로 작동하지 않고 top20의 결과가 한 글자 단어도 포함되어 나옵니다.
이 과정에서 혹시나 하여 df_word <- as.data.frame(wordcount, stringAsFactors= F)로 바꿔보았더니 정상적으로 작동을 하던데, 이게 맞는 것인지 궁금합니다. 이게 맞다면 stringAsFactors= F가 어떤 기능을 하는지 대략적으로 알려주셨으면 합니다.
위 오류와 관련해선 직접 코드를 작성하고 실행해본 캡쳐본도 남기겠습니다. 감사합니다.