vlambda博客
学习文章列表

Zotero:文献管理工具中的VSCode

本文旨在介绍这款协助科研工作者收集、管理以及引用研究资源的免费软件 Zotero!”


目前比较广泛使用的文献管理软件有:

  • EndNode(WoS家-收费)

  • NoteEpress(国产-北京爱琴海软件公司-收费)

  • Mendeley(Elsevier家)

  • Zotero(开源野路子)

  • Citavi(瑞士人整的-免费版有限制)

  • Readcube(收费)

  • 知网研学(原E-study-有限免费)

  • Papers(Mac系统独有-免费试用30天)

  • JabRef(开源-BibTex)

  • Paperpile(免费试用30天)

  • 此外还有一些小众产品:如SnowyOwl、TagSpaces、IvySci(包括IvyCite)、F1000 workspace等。


他们似乎各有千秋,人气都很高,但一个跨平台甩出来,Citavi首先应声落马。Citavi虽然看上去功能很强大,基本上是其他所有文献管理软件的并集(这也许就是瑞士军刀精神吧,俗称大杂烩),但是这家伙只支持Windows,对于Mac的官方支持是指导你装一个Windows虚拟机,更别提什么手机平板了,这显然是让人无法接受的。F1000 workspace是 F1000旗下产品,和其他几个工具不同,F1000 workspace不需要本地客户端,可以直接上传PDF并通过浏览器阅读和标注,只要有一个浏览器就可以使用。


01

需求:我需要一款怎样的文献管理软件?


我们在查阅和收集paper归门别类时,需要有一个“完美”的文献管理软件来助力,希望ta有下面这几个特点(按重要性排序):

  1. 对文献进行有效归类:用层级文件夹进行管理的缺点在于检索、整理的困难。最好能够为文献打上不同的标签,并且根据标签进行检索。比如“object detection”、“GAN”、“导师让审的投稿”、“导师发的每次能引就引的文章”、“我的学术垃圾”等。

  2. 跨平台同步:比如希望实验室台式机上没看完的文献,笔记本电脑上能接着读;笔记本上没读完的,平板电脑上能接着读;平板上没读完的,可以拉屎的时候用手机接着读。

  3. 灵活增添条目:我们一般会在Google Scholar和arXiv上找文献。对于arXiv来说,基本都能直接下载到pdf文件,希望可以高效地连基本信息带pdf一起丢进文献库。对于Google Scholar,有时不能直接下载原文,希望可以先把基本信息丢进去,在acm dl/ieee explore/某hub上下好了pdf之后再补一手。

  4. 免费:最好可以免费享受到以上服务。


Zotero具有两大程序员特质:

  • WebDAV(我们就简单地认为是一种同步云盘协议):意味着我们可以使用其他廉价、快速的同步云盘代替官方的云同步系统,以避免高昂的空间购买费用和与国外服务器的通信障碍。800多篇文献大约占用3GB的空间,所以免费空间一定是不够用的。

  • 插件:简直是开源社区的精髓所在。自定义插件给用户们提供了广阔的空间,极大扩展了软件本身的边界,想想我们用的Chrome和VSCode。


上面这两个优势,可以说吊打其他所有文献管理软件。当然,这种模式并不适合所有人,如果你是以下几种用户之一,我认为你可以更多地考虑其他优秀、成熟的文献管理软件:

  1. 不太愿意动手做定制,更希望“开箱即用”。

  2. 对跨平台性和云同步没有需求。

  3. iPad用户。(唯一可用的第三方App PaperShip同步功能失效了)

  4. 希望在文献管理软件内进行pdf的批注,或希望对pdf进行全文检索。(这是Zotero目前最欠缺的两个特性)


在官方网站中,有一篇文章专门替用户剖析了为什么要使用Zotero。以下是我们把其当做自己主力文献管理的几个主要原因:

  • 软件本身完全免费并且开源,不存在盗版问题

  • 注册后本身只包括300M空间同步,但支持WebDAV同步,例如Dropbox 和坚果云等

  • 官方的反馈论坛比较活跃,有问题可以快速得到反馈

  • 从网站和期刊文章等提取保存出版物数据检索

  • 拖入 PDF 的出版物数据准确率高

  • 可以和 Word,LibreOffice 集成,方便文献进一步的使用管理

  • 强大的第三方插件系统

  • 每个条目下可以添加任意数量和格式的附件


当然,使用一个工具首先要了解其上限和下限,Zotero同样有着比较明显的短板:

  • 因为强大所以上手时略显复杂

  • 并不是一个完全基于Web的工具

  • 没有内置的PDF阅读工具

  • 没有适配于iOS和Android的官方应用程序



作为普通用户,商业性文献管理器不推荐了,因为收费不一。所以最好推荐开源文献管理器,免费而且好用是最佳选择。排除商业性文献管理器(国外:EndNote、ReadCube、SnowyOwl、Citavi和TagSpaces,国内:NoteExpress和知网研学),就只剩下Zotero和Mendeley(国外文献管理器)和IvySci(国内文献管理器)三款了。作为免费文献管理器,Zotero、Mendeley和IvySci也对得起普通用户了。


首推的是Zotero,软件小而且可以建立多个子目录来管理文献。最主要还是免费的同时,使用起来很顺畅。无需联网登录,中英文文献都支持。第二款是Mendeley,免费并且有社区功能。提供每篇论文的Altmetric评价指标。缺点是需要联网登录,不方便。第三款是IvySci,国内文献管理器潜力股,提供论文写作(IvySci)和文献引用(IvyCite)服务,甚至还提供进行卡片式记忆功能。现在免费,不知道过几年是什么情况了。整体而言,Zotero文献管理器在各方面最合适普通用户的需求。



02


Zotero的使用和学习路径


最权威和最新的学习资料一定是 官方文档。目前有针对 Zotero 4 旧版本的 中文说明,如果英文吃力也可以参考。

2.1 添加内容到文献库

1)使用浏览器插件:不同于一些工具,Zotero 的 浏览器插件 称得上可以「保存一切」。当所在的网页呈现出不同的内容时,Zotero的插件会呈现出不同的图标。例如,如果打开的是 PDF,那么图标就会变成 PDF。


如果一个网页内有多个文献元数据,可以检测到并同时保存多篇文章。即便是一篇博客,也可以直接保存。

Zotero:文献管理工具中的VSCode


下图为直接保存博客网页后的效果,可以看到它也会抓取部分内容作为摘要进行显示。

Zotero:文献管理工具中的VSCode


如果你好奇 Zotero 支持导入的内容包括什么,可以参考下面这个截图。

Zotero:文献管理工具中的VSCode


2)使用各种标识符在应用内添加:对于添加文献或者书籍,如果我们知道了它对应的 ISBN,DOI 或 PubMed ID,就可以快速将项目通过标识符添加到库中。

Zotero:文献管理工具中的VSCode


单击Zotero窗格中间列顶部的「按标识符添加项目」按钮,输入标识符后按Enter。如果要一次输入多个标识符,在输入第一个标识符后按 Shift + Enter会进入多行模式,随后输入其余标识符(每行一个),并通过 Enter 换行。输入完成符后,再按 Shift + Enter 即可一次导入所有项目。

Zotero:文献管理工具中的VSCode


3)本地PDF文件和各种附件直接拖入应用:如果你有已经下载好的PDF版本文献,只要直接拖入到应用中即可,Zotero会自动识别 PDF 文档中的元数据。



结合WebDAV的同步功能,我们还可以将这些相关资料在多个设备间进行同步,这样就极大的方便了我们对文献相关的各种资料进行整理。


4)从其它工具导入:Zotero支持从多种工具的数据导入,且支持的导入格式非常丰富。例如 Mendeley 的数据库,Endnote 的 XML 格式,以及常见的 RDF 和 RIS 格式等等。更多格式见下图截图。

Zotero:文献管理工具中的VSCode


5)通过feed进行订阅:如果你是一个喜欢追文献的人,肯定有各种各样自己的方法,例如通过邮件订阅或者RSS等,而Zotero本身也为我们提供了一种非常方便的方法。

Zotero:文献管理工具中的VSCode


Zotero:文献管理工具中的VSCode


2.2 文献和笔记管理

1)集合与标签:集合可以理解为支持多个层级的文件夹,如下图在一个合集中新建一个子集。

Zotero:文献管理工具中的VSCode


除了按照目录分类以外,可以为每个文献添加若干个标签。这里建议标签的使用维度不和集合重合。例如,我有个一个叫做「lncRNA」的目录集合,就不应该再建立一个「lncRNA」的标签,这时的标签可以考虑应用维度或者重要性维度。如使用 P1、P2 和 P3 标注文献的重要性,使用「中期」「答辩」等标注一个文献的用途。


每个标签可以设置对应颜色,这个色块也会自动显示在每一个条目的开头,方便查看,一目了然。

Zotero:文献管理工具中的VSCode


2)搜索:在 Zotero 中,快速搜索支持如下图所示的三种粒度。需要说明的是,如果 PDF 文档已经建立过,通过「所有内容」进行搜索时是可以搜索到文档文本的。

Zotero:文献管理工具中的VSCode


除了快速搜索以外,Zotero中还有一种高级搜索方法。高级搜索提供比快速搜索更多更精细的筛选条件,并允许保存搜索内容方便下次使用。


运行高级搜索需要打开「高级搜索」窗口,单击中心窗格顶部的放大镜图标,然后就会进入高级搜索界面,搜索支持逻辑判断且可搜索的条目也非常之多。

Zotero:文献管理工具中的VSCode


3)排序和关联:每个集合都支持显示若干需要的内容并且按照某种方式进行排序,且支持二次排序。

Zotero:文献管理工具中的VSCode


另外,不同的文献之间、文献和笔记之间都可以进行关联。我们可以方便地将关联性强的内容结合到一起。


4)笔记:每一篇文献支持插入多个笔记。笔记支持的格式内容也非常丰富,例如引用和插入链接以及添加不同层级的标题都没有问题,而且笔记还可以和多篇文献进行关联。


默认笔记本事是富文本编辑器,不支持markdown语法。但因为Zotero的插件和 Firefox的插件格式相同,我们只需要把Firefox的markdown here插件稍加修改打包就可以导入Zotero中,从而使笔记支持markdown。这里已经将插件打包好,你可以 点击链接下载安装。

Zotero:文献管理工具中的VSCode

2.3 生成引文和报告

无论使用Endnote还是使用Mendeley抑或使用Zotero,一个非常重要的需求就是在平时写各种论文的过程中插入参考文献。Zotero可以从哪些方便满足你的需求呢?

Zotero:文献管理工具中的VSCode


1)快速复制:如果你只希望在自己的博客或者笔记中插入一些文章而无需遵守严格的引用要求。那么 Zotero 本身提供了非常方便的快速复制方法。


在设置中可以设置复制时需要的引文格式,然后只需要拖拽即可,非常自由。

Zotero:文献管理工具中的VSCode


2)多篇文献右键多种导出:当你同时选择多篇文献时,也可以通过鼠标右键选择你需要导出的形式。例如 RTF 或者 HTML,当然,你也可以选择直接复制然后一步粘贴到位。

Zotero:文献管理工具中的VSCode


3)在Microsoft Word中使用插件:通常安装软件的时候就会提示自动安装 Word 插件,如果因为各种原因前期没有安装,可以在设置的引用中进行安装,安装后重启 Word 即可。


安装好之后 Word 中就会出现如下 Zotero 插件:

Zotero:文献管理工具中的VSCode


Word 中的 Zotero 选项卡包含以下内容:

Zotero:文献管理工具中的VSCode

在正式插入引文之间,需要设置引文的格式和语言,通过管理样式可以轻松找到海量的引文格式。如果需要显示中文,则可以在语言选项中选择中文。

Zotero:文献管理工具中的VSCode


在需要添加引文的位置点击添加选项

Zotero:文献管理工具中的VSCode


在出现的搜索框中可以使用各种方式来快速搜索自己需要插入的文献,例如作者姓名。

Zotero:文献管理工具中的VSCode


如果需要在一个位置内引用多篇文献,可以一次选择自己多篇想添加的内容统一添加。

Zotero:文献管理工具中的VSCode


所有文献都引用好之后,直接点击书目即可插入引文。

Zotero:文献管理工具中的VSCode


4)生成报告:除了插入参考引文之外,Zotero还给出了另一种导出参考文献的方式——生成报告。


报告是简单的HTML页面,概述了所选项目的项目元数据,注释和附件。可以打印它们,也可以将它们发布到网上并通过电子邮件发送。


创建报告可以右键单击中心窗格中的项目或选项,然后选择「由所选条目生成报告…」,也可以右键单击左列中的集合,然后选择「从集合生成报告」。


Zotero:文献管理工具中的VSCode

第三方工具插件可以帮助你更好地过滤报告内容,例如对报告进行排序或者增删条目等。

Zotero:文献管理工具中的VSCode


2.4 备份和协作

1)同步:Zotero本身支持300M免费的存储空间。这对很多人都是不够的,如果你不想购买官方的存储空间可以使用WebDAV服务。这里就不做展开介绍了,以国内使用比较方便的「坚果云」为例,官方给了一个比较详细的配置方法教程:如何在 Zotero 中设置 webdav 连接到坚果云。


2)协作:协作功能可能是很多人都忽略掉或者不知道的一个功能。Zotero提供了相对完善的协作方式,这里做一些介绍。


如果你想和实验室或者几个好用共享协作一个文献库,那么就可以创建一个私有库,需要去官网创建,方式如下。

Zotero:文献管理工具中的VSCode


随后还有一些具体的权限需要设置,例如什么人可以读,什么人可以编辑。

Zotero:文献管理工具中的VSCode


创建好之后,如果你的客户端已经登陆并且完成同步,将会在侧边栏出现一个新的群组。如下图所示。

Zotero:文献管理工具中的VSCode


另外,在网页版的管理界面中可以进行成员邀请和删除。


2.5 其它内容

1)插件推荐:插件系统是Zotero作为开源软件的独特优势,你可以通过官方插件网站 进行查看。我目前在用的几款插件如下图所示,推荐安装使用。

Zotero:文献管理工具中的VSCode


常用的有:

zotero-better-bibtex-5.2.53.xpi

zotero-cita-v0.3.3.xpi         

zotero-citationcounts-1.2.0.xpi

zotero-doi-manager-1.4.1.xpi   

zotero-mas-metadata-0.1.6-fx.xpi

zotero-ocr-0.5.0.xpi           

zotero-scihub-1.4.0.xpi        

zotero-scite-1.11.1.xpi        

zoteroquicklook.zoteroplugin   

zotfile-5.1.0-fx.xpi           

zotodo-0.7.0.xpi               

zsc-2.0.4-fx.xpi


小技巧

  • 当选择了一个项目时,可以通过按住 Option(Ctrl) 键突出显示包含此项目的所有集合,也就是知道这篇文献所在的分组

  • 在集合列表或项目列表中的键盘上按 +(加号)可以展开所有节点,按 -(减号)则可以折叠

  • 要查看所选库或集合中的项目数可以单击然后使用 Command-A(Ctrl-A) 全选,计数将显示在右侧

  • 若使用快速复制功能,在将项目拖放到文本文档时按住 Shift 键能实现插入引文而不是完整引用

  • 可以单击详细信息中的 DOI 和 URL 字段标签直接打开链接


03


查阅文献软件推荐


3.1 用Harzing’s Puhlish or Perish找文献

Harzing’s Puhlish or Perish是很强大的文献检索工具,给定关键词,可以找相关文献,每个文献的引用量,并一键获取某个文献的引用文献。搜索结果有总引用量和年引用量的排序,完美解决google scholar无法按照引用量培训的问题,方便找到该领域关键文献。支持google scholar,corssref等搜索引擎,最大返回1000篇搜索结果。搜索结果可以保存为常见的文献格式,比如BibTex,json等。

Zotero:文献管理工具中的VSCode


3.2 用CaptureScreen和bTranslate看文献

翻译和文字识别是看文献最常见的需求,比如为了整理报告,记录文献笔记等。


首先是文字识别,有很很老的文献的pdf是图片格式,没法复制上面的文字,键盘敲一遍太麻烦,可以借助ocr技术识别完成。百度提供了每天5万次OCR免费调用量,因此编写了小软件,截屏后发送识别请求,直接识别其中文字保存粘贴板和结果文件。界面如下,可以直接矩形截屏,识别整个PDF文件,或者多个图片文件。


其次是翻译问题。包括大段的翻译和单词的翻译。大段的翻译同样调用了百度的人工智能翻译接口,可以实现大段的中英文互译。可以自动识别复制文字中的换行符(这个你懂的)。可以查询单个的英文解释,调用了韦氏词典和免费词典的接口。


CaptureScreen和bTranslate下载链接

https://cowtransfer.com/s/439c6b15d6ae49

https://cowtransfer.com/s/84574972e19340


参考资料:

[1] 文献管理神器 Zotero 学习路径指南

https://sspai.com/post/56724

[2]Zotero+坚果云,免费跨平台文献管理最佳实践指南

https://zhuanlan.zhihu.com/p/112795057

[3] 科研人员看文献的4款神器

https://mp.weixin.qq.com/s/89I-bE9ct-wrDdrwHd6FBg


配图:小钟不是小钟

责任编辑:小钟不是小钟

排版审核:Jerry916

校对审核:Jerry916