讲座预告 | 【R语言专场(二)】之“文本挖掘”
还在为如何做定量研究发愁?
不知R语言是为何物?
快来听教研院主办的R语言专场讲座,
专门为你打造,
手把手教你如何玩转R语言.
讲座信息
主题
[R语言专场]——文本挖掘
主讲嘉宾
郑思尧,清华大学政治学系博士候选人,未来学者奖学金获得者。本科毕业于北京大学政府管理学院,硕士毕业于清华大学公共管理学院。研究方向为数字与信息政治、国家理论、中国政府与政治和大数据政治学。论文发表在Journal of Contemporary China、《公共行政评论》、《经济社会体制比较》和《公共管理与政策评论》等 SSCI 和 CSSCI 期刊上,担任 Journal of Chinese Political Science 匿名审稿人。研究成果在美国中西部政治学年会和美国中国政治学年会等国际会议上报告。担任清华大学定量俱乐部讲师,清华大学计算社会科学 Python 工作坊讲师,“政知坊”政治科学研究工作坊执委会成员。
讲座内容
本讲的内容是R语言中的文本挖掘。首先,我们将介绍R中文本数据清洗的方法;其次,我们将尝试用有监督学习对实现一个垃圾邮件的自动分类器;再次,我们将学习LDA模型,并尝试对新闻内容进行无监督分类;最后,我们将领略文本挖掘技术在社会科学中的一些应用案例。
课前准备
安装R和Rstudio
安装tm, ctm, jiebaR, topicmodels, stm和keyATM软件包
讲座时间
2022年4月22日(周五)19:00-21:00
讲座地点
线下:文南楼404室
线上:腾讯会议号 887-680-265
报名方式
扫描下方二维码填写问卷即可~
教育研究院学术支持Workshop简介
清华大学教育研究院研究生分会自2020年秋季学期开始定期组织开展“教育研究方法workshop”,同时组织假期教育实践活动,提供实际操作平台,极大地增进了学院学术软环境的建设,得到了教研院师生的热烈反馈。
本学年,教研院研会将在“教育研究方法workshop”的工作基础上开展“教育研究院学术支持workshop”,包括教育研究方法、读书治学经验、课程支持与辅导三个板块,扩充了学术支持的内容和面向对象,对教研院同学的需求覆盖更加全面、个性,有利于为同学们增进教育研究理论与方法提供针对性、实用性支持。本项目获得清华大学院系学生学习与发展指导计划资金的支持,欢迎同学们积极参与!
文字、排版|孙艺霞