主动离婚的女性为何选择离婚?一项简单的R语言文本分析
目的:
利用文本分析简单探究主动离婚的女性为何选择离婚
方法:
利用R语言进行文本分析
文本来源:
说明:
分析的工作路径是桌面的名为devoice的文件夹,将11个独白文字片段整理到一个名为devoice.txt的文档中,存在于devoice的文件夹;
利用R语言将分割好的文字存为1.seg.txt,在devoice文件夹中新建corpus子文件夹,将1.seg.txt放入,然后生成词云。
library("Rwordseg")
library("jiebaR")
library("stylo")
library("wordcloud2")
#读取文件
text <- scan("reason.txt", what = "char", sep = "\n")
text.seged <- segmentCN(text, analyzer = c("jiebaR"), returnType = "tm")
text.seged
cat(text.seged, file = "C:/Users/ASUS/Desktop/devoice/1seg.txt")
mycorpus <- load.corpus(corpus.dir = "C:/Users/ASUS/Desktop/devoice/corpus",
encoding="ASCII")
chinese <- txt.to.words(mycorpus)
chinese
wordfreq <- make.frequency.list(chinese, value=T, relative = F)
df <- data.frame(wordfreq)
df <- df[-c(1,2,3,4,5,7,8,9,11,12,13,14,16,
17,18,19,20,21,22,23,24),] #同时删除多行数据框,目的是将无效词删掉
plot(df$Freq)
barplot(df$Freq[1:20], names.arg = df$data[1:20])
wordcloud2(df,shape = "circle")
输出图形如下:
从上图可以看出,除了"离婚"、"结婚"高频词外,"孩子"、"自己"凸显了出来。表明在考虑离婚的过程中,女性将孩子和自我摆在了较为重要的位置。
欢迎关注:
欢迎点击下方"在看"