Skip to content

교재 10 chapter 텍스트 마이닝 관련 질문입니다. #77

@hyeonho-jang

Description

@hyeonho-jang

안녕하세요, 저자님.
저자님의 교재를 통해 R언어를 공부 중인 한 학생입니다. 다름이 아니라 텍스트 마이닝 챕터 학습 중 여러 문제점과 의문점이 생겨
질문을 남깁니다.

먼저, pg.265를 보면 KoNLP 패키지 사용을 위해 자바 설치가 필요하다고 하는데 책에는 install.packages를 통해 R스튜디오 내에서 자체적으로 자바 설치를 통해 바로 KoNLP 패키지 설치 및 사용이 가능한 것으로 나와 있습니다.

그러나 실제로 시도해본 결과 이는 불가능했고, 이에 깃허브에 방문하여 저자님이 올려주신 아래 링크를 통해 자바를 설치한 후에야 정상적으로 작동되었습니다.

https://github.com/youngwoos/Doit_R/blob/master/FAQ/install_KoNLP.md

제가 이해한 것처럼 자바를 직접 다운로드해야 정상적인 이용이 가능한 것인지 묻고 싶습니다. 이와 더불어 위 링크에 4번인 < scala-library-2.11.8.jar파일 다운로드하기> 과정이 텍스트 마이닝에 필수적인지, 이 파일이 어떤 기능을 하는지 알고 싶습니다. 교재에는 이 내용이 없기 때문입니다.

이와 더불어 교재 pg.274를 보면 df_word <- as.data.frame(wordcount) 이후 두 글자 이상 단어 추출을 위해 filter와 nchar 함수를 이용하는 부분에서 교재와 동일하게 작성하였는데도 정상적인 작동이 되지 않아서 추가적인 질문을 드리고 싶습니다.

교재에 나와있는 대로 작성을 할 경우 nchar 함수가 오류와 함께 정상적으로 작동하지 않고 top20의 결과가 한 글자 단어도 포함되어 나옵니다.

이 과정에서 혹시나 하여 df_word <- as.data.frame(wordcount, stringAsFactors= F)로 바꿔보았더니 정상적으로 작동을 하던데, 이게 맞는 것인지 궁금합니다. 이게 맞다면 stringAsFactors= F가 어떤 기능을 하는지 대략적으로 알려주셨으면 합니다.

위 오류와 관련해선 직접 코드를 작성하고 실행해본 캡쳐본도 남기겠습니다. 감사합니다.

Rscriptbefore

Rconsolebefore

Rscriptafter

Rconsoleafter

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions