vlambda博客
学习文章列表

主动离婚的女性为何选择离婚?一项简单的R语言文本分析

目的:

利用文本分析简单探究主动离婚的女性为何选择离婚


方法:

利用R语言进行文本分析


文本来源:


说明:

分析的工作路径是桌面的名为devoice的文件夹,将11个独白文字片段整理到一个名为devoice.txt的文档中,存在于devoice的文件夹;

利用R语言将分割好的文字存为1.seg.txt,在devoice文件夹中新建corpus子文件夹,将1.seg.txt放入,然后生成词云。


library("Rwordseg")
library("jiebaR")
library("stylo")
library("wordcloud2")

#读取文件
text <- scan("reason.txt", what = "char", sep = "\n")

text.seged <- segmentCN(text, analyzer = c("jiebaR"), returnType = "tm")

text.seged

cat(text.seged, file = "C:/Users/ASUS/Desktop/devoice/1seg.txt")



mycorpus <- load.corpus(corpus.dir = "C:/Users/ASUS/Desktop/devoice/corpus"
                        encoding="ASCII")

chinese <- txt.to.words(mycorpus)

chinese

wordfreq <- make.frequency.list(chinese, value=T, relative = F)

df <- data.frame(wordfreq)

df <- df[-c(1,2,3,4,5,7,8,9,11,12,13,14,16,
            17,18,19,20,21,22,23,24),] #同时删除多行数据框,目的是将无效词删掉

plot(df$Freq)

barplot(df$Freq[1:20], names.arg = df$data[1:20])

wordcloud2(df,shape = "circle")


输出图形如下:



从上图可以看出,除了"离婚"、"结婚"高频词外,"孩子"、"自己"凸显了出来。表明在考虑离婚的过程中,女性将孩子和自我摆在了较为重要的位置。




欢迎关注:

欢迎点击下方"在看"