vlambda博客
学习文章列表

大数据:R语言快速分析科研领域

搜索论文是科研工作必不可少的环节,阅读论文更是了解前沿研究的重要手段。比较期刊的影响因子和论文的引用量是分析科研领域相对直接的方法,但为了更全面了解科研领域,我们通常更关注三个问题:
  • 哪些作者比较牛?

  • 哪些期刊比较火?

  • 哪些主题比较热门?

数据爆发的时代提供了高效快速分析大数据的契机,运用数据科学分析科研领域成为回答上述三个问题有效手段。在数据科学领域,除了如今大火的Python外,老牌编程语言R语言也占据了重要地位。抗震新西兰将使用R语言环境下的工具包BiblioShiny,以“基于深度学习的建筑损伤识别”研究领域为例,展示分析结果。




R语言简介




R语言是一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。 R语言最早是由新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发,现在由“R开发核心团队”负责开发。R语言与Python同样支持大量第三方类库和工具包,广泛运用于数据科学和人工智能。



数据获取




  • 登陆Web of Science,数据库选择核心集(Core Collection),输入关键词building damage detection和deep learning。

大数据:R语言快速分析科研领域

  • 在搜索结果页面点击Export,在下拉菜单中选择Other File Formats。


大数据:R语言快速分析科研领域


  • 在Record Content一栏中选择Full Record and Cited References(所有记录和引用文献), 并在File Format一栏中选择Plain Text(纯文本)。

大数据:R语言快速分析科研领域




结果分析




  • 哪些作者比较牛?


大数据:R语言快速分析科研领域

“基于深度学习的建筑损伤识别”领域作者Top10


  • 哪些期刊比较火?

“基于深度学习的建筑损伤识别”领域最火期刊Top3依次为《Computer-aided civil and infrastructure engineering》、《Remote sensing》和《Neurocomputing》。

大数据:R语言快速分析科研领域


  • 哪些主题比较热门?

语义地图中的每一个结点代表一个分类,结点之间的连线代表不同分类之间的相关性。 在“基于深度学习的建筑损伤识别”领域,深度学习、损伤识别和分类是三个最关键分类,与之相关的分类包括卷积神经网络、裂缝识别、结构健康监测和计算机视觉等。

大数据:R语言快速分析科研领域

语义地图


主题对应分析图共分为四个象限,第一象限表示研究成熟的主题,第二象限表示重要且需要研究的主题,第三象限表示未来即将出现的新主题,第四象限表示基本概念和理论的主题。 在“基于深度学习的建筑损伤识别”领域,最主要的基本概念是深度学习和迁移学习,目前尚未有研究成熟的主题,目前重点研究的主题包括卷积神经网络和结构健康监测,未来即将出现的主题是计算机视觉。

大数据:R语言快速分析科研领域

主题对应分析图

大数据:R语言快速分析科研领域

大数据:R语言快速分析科研领域

往期精彩回顾

大数据:R语言快速分析科研领域

SHM探索





地震工程








点个好看,让更多人认识我们