PDF 阅读与注释的实践——知之阅读、Markdown+Git、Kami、Edge、Mendeley、Zotero
原始文档:https://www.yuque.com/lart/tools/zotero
过往的尝试
作为一个普通的学生,读论文,做笔记是日常生活的一部分。之前一直找不到一个趁手的工具。前前后后基本上试用了不少主流和非主流的工具,他们各有缺点,这里也简单回顾下。
- 知之阅读:这款软件是 Windows 平台专属的一款针对 PDF 阅读和注释的软件,也是我尝试的比较早的一个工具。在软件内部标注和管理 PDF 都很方便,而且所有数据都保存在本地,不涉及到云存储的问题。PDF 和注释都是分离的,所以不会直接修改原始的 PDF。但是 PDF 做的笔记都被存储到了软件本身的数据库里,并且不支持导出。这一点就很危险,因为如果软件本身的数据库文件一旦受损,那就完了。虽然可以通过自动同步备份来解决这一问题,但是仅限于 Windows 平台,以及位于本地的笔记无法导出用于其他用途,确实一度打消了我对它的好感。
- Markdown+Git:这个时期比较重视对于个人数据的管控和格式简单的追求。于是开始基于纯文本格式进行记录信息。可以看到,此时并没有对 PDF 进行保存。这可能也和所处领域有关。因为我们领域大多数的论文都是公开可以获取的,所以文档中只需要保留一个论文链接即可。这一流程有一点明显的好处就是开始迫使我的笔记变得内容更加完整,由于文本内容在分享传播上的便捷,也帮助我整理了不少博客文章。
- Kami on Chrome/Edge+Google Drive:这是当网络足够畅通时,我曾经的最喜欢的一种选择。由插件 Kami 提供的在线的 PDF 注释的支持(免费版本的功能足以满足你的绝大多数需求),通过内置的对于 Google Drive 的支持,可以保证将 PDF 文件和注释信息直接保存到你自己的网盘空间中的 PDF 文件里,即使你脱离 Kami,直接在 Google Drive 中打开保存后的 PDF 文件,那些注释信息依然可读,真的是非常的方便。可惜对于国内云盘的支持并不是太好,也不支持 WebDAV。虽然也支持 OneDrive,但是其垃圾的同步速度,直接被我放弃。
- Edge 自带的 PDF 阅读器:随着 Edge 的更新,PDF 阅读工具也越来越好用,基本上为跨平台的本地阅读和注释提供了足够方便和有效的支持。其中的注释也是直接被保存到文档中。但是美中不足,同步很不方便,笔记也难以直接导出。而且注释多了以后会有些卡顿。但是用作日常的轻量使用时没有问题的。
- Mendeley:在我当初的使用中,主要是看中了其内置的 PDF 阅读和注释工具。同时由于其属于专门的文献管理工具,在 PDF 管理上要比之前的那些手工管理方式要更加方便一些。但是美中不足,云存储空间太小。而且注释导出非常不方便。另外由于第一次借助这一类软件,其繁多的功能让我有些无从下手,感觉有些复杂就不再使用了。不过印象深刻的是其服务商提供的相关文献推送的功能。这应该是对云端存储的我们的个人数据进行了分析。
Zotero
接下来就到本文的正主 Zotero 了。其实之前也关注过 Zotero 这款文献管理工具。但是那时其更多是一个“管理”工具,文献的阅读和注释等需求并没有提供相应的支持,而相较于管理,我更优先看重 PDF 阅读和批注功能。所以那时也就没有更多的尝试。但是之前看到消息,提到 Zotero5 的 Beta 版本中已经开始测试 PDF 阅读工具了。考虑到仍然处于测试阶段,没有去尝试。平时仍然是使用 Edge 来本地阅读,如果有记录的需求,就直接使用 Kami+Google Drive 的组合。 直到最近,看到了一条消息——《解决科研人痛点的大突破:Zotero 6.0 版有哪些亮点?》。Zotero 发布了大版本 6.0 的更新。其中最吸引我的一点是,开发团队正式将之前一直处于测试阶段的 pdf 阅读和注释功能已经出现在这一正式版本中。我觉得或许已经值得一试了。 通过各种配置和简单使用之后,发现内置的 PDF 阅读器提供的功能虽然简单但却是最必要几点。可见开发团队真是专门为科研人员而优化呀! 软件本身并不复杂,对于日常使用而言,需要专门配置的主要是同步功能,这主要涉及到几个重要但是有着不同功能的文件夹。对此,网上搜索“Zotero 同步”便可以看到诸多的帖子。虽然都可以用,但是在实际你自己的配置中,你仍会或多或少的产生一些疑惑——这些文件夹的用处是什么?如何选择更合适的备份方式? 接下来结合官方文档具体说一下(这里以 Zotero 6.0.2 版本中中文界面下为例)。
高级->文件和文件夹->数据存储位置
该部分可参考文档The Zotero Data Directory。该文件夹用于存储 Zotero 自身的数据库文件和各种附件。在复制、删除或移动这些文件之前,请确保 Zotero 已关闭。在移动这些文件之前不这样做,可能会损坏数据。
zotero.sqlite
这里最重要的文件就是zotero.sqlite 这样一个数据库文件了。其中包含着你的数据的主体:各个条目的元数据、笔记以及标签等等。当软件启动时,其会读取该文件。
storage
这个目录下也包含着一个重要的目录,storage 。其中包含着所有的附件文件,包括 PDF、截图、音视频文件以及其他你导入 Zotero 中的文件。被链接的文件不会自动复制到此子目录中。 默认设定中,Zotero 的做法是对每一个条目的所有文件(笔记,附件等)都放在一个随机命名的文件夹下,当我们想通过名字找对应的附件的时候就非常不方便了。 该文件夹的同步,实际上也对应着 Zotero 同步概念中的“File Syncing”。官方提供了三种方式:
- 直接使用 Zotero 提供的同步存储功能(空间小,但是集成度更好)。
- 通过 WebDAV 搭配第三方同步盘(可选范围广,空间更自由)或者如果附件并不是直接存储在该文件夹,而是通过连接形式直接关联,那么在该
File Syncing 部分中,仅仅会同步该文件夹下的那些非链接文件。 - 通过 Zotero 提供的 ZotFile 插件来解决这个问题,它能把附件文件变成链接文件并将原始文件存储到
Location of Files 中并进行重命名和归类。
others
另外,也可能会包含其他文件:
zotero.sqlite.bak (这是zotero.sqlite 的一个自动备份,这将会在软件退出并且现存的zotero.sqlite.bak 文件在过去 12 个小时里没有被更新时,对zotero.sqlite 进行更新)zotero.sqlite.[number].bak 是在某些 Zotero 更新期间创建的 zotero.sqlite 的自动备份。
数据备份
由于该文件夹涉及到最关键的用户数据,所以跨设备 Zotero 的使用需要考虑对于该文件夹的备份与同步。同时官方也强烈建议定期备份 Zotero 数据库。 直接同步这一文件夹并不是最好的选择。
- 这部分的同步即为 Zotero 同步中的数据同步。同步内容可以包含文献库的条目、笔记、链接、标签(关键词) 等等。可以使用 Zotero 提供的同步服务同步除了附件之外的所有内容,以便在不同的支持 Zotero 的设备上使用 Zotero。此外,还可以登录 Zotero.org 在线查看文献库。数据同步是免费和无限的,无需文件同步即可使用。
- 虽然 Zotero 服务器会自动存储,但是其只存储最新版本的库,每当你自动/手动同步一次,那就可能完全更改服务器中的副本。
- 备份的时候,不要仅仅只备份数据库文件,建议使用备份程序,定期将整个硬盘驱动器自动备份到外部设备,并保留增量备份,以便可以还原到指定版本。
- 如果确实要专门备份 Zotero 数据,关闭 Zotero,然后复制整个数据文件夹(包括
zotero.sqlite 和storage 在内的整个文件夹)到备份位置,最好在另一个存储设备上。与 - 所有重要数据一样,经常备份 Zotero 数据是一个好主意 (这就是为什么官方建议使用自动化的全系统备份)。
高级->文件和文件夹->链接附件的根目录
如果在 Zotero 中存储附加文件,即默认设置,此设置不会产生直接的影响。**它只适用于被链接的文件。**此设置保证了只要数据位于该目录下,Zotero 内部会使用以该目录为基点的相对路径的形式来索引这些文件。这使得即使附件存储在每台计算机上的不同位置,也可以在多台计算机上方便的访问这个文件夹下的被链接的文件。 **应该将该目录设置为每台计算机上存储链接文件的文件夹。**例如,如果被链接文件的文件夹在笔记本电脑上的/Users/Sarah/Dropbox ,而在工作电脑上位于C:\Users\Sarah\Dropbox ,则各自将该目录设置为对应的路径即可。如果在基本目录中添加被链接文件,则 Zotero 将存储一个相对于该目录的相对路径。 请注意,该设置并不会控制文件的位置——只是调整了该文件夹中的被链接文件在 Zotero 中使用相对路径形式的引用,而其他文件夹中的文件会仍然使用绝对路径。 如果使用 ZotFile 插件来帮助使用链接文件工作流,则应将其对应的配置项**Location of Files** **设置为该目录,以移动新添加的和现存的附件到该目录中进行统一管理和索引。**还可以同步调整文档的命名。 该目录可以通过同步盘进行监控并同步。
个人使用的简单设定
高级->文件和文件夹->链接附件的根目录
- 使用一个单独的文件夹,基于坚果云进行同步。
- ZotFile 的
Location of Files 设置为该目录。 高级->文件和文件夹->数据存储位置 设置为一个新的便于访问的文件夹(默认其实也可以)。设置完之后,将原始的文件夹下的内容剪切到新目录下即可。- ZotFile 的
Source Folder for Attaching New Files 的设置有两种策略:
高级->文件和文件夹->数据存储位置 目录下的storage 文件夹路径。值得注意的是,手动向 Zotero 中拖入文档或者添加附件副本时,Zotero 会自动将其拷贝存储到**storage** 文件夹中。- 直接设置成设置成浏览器的下载目录。作者推荐该设置。
关于文件同步设定更具体的介绍
这篇文章https://blog.csdn.net/qq_43012930/article/details/114137259对于两种不同的同步思路的介绍十分细致,这里摘录一下:
方式一
PDF 文件保存在 Zotero 的 Storage 文件夹里 (乱码的子文件夹名称),用 WebDAV (坚果云)进行同步,此方法无需下载坚果云客户端,在网页端即可操作。具体过程如下:
- File Syncing 的设置
- 首先,我们需要去坚果云官网注册个人账号。注册好之后在坚果云个人中心的“账户信息”中找到“安全选项”选项卡。在页面下方的“第三方应用管理”中添加一个应用,生成密码。
- 接下来打开 Zotero 的同步配置,在下方同步方式中选择“WebDAV”,填入刚才坚果云页面中给出的服务器地址和账户,密码就是刚才生成的应用密码。点击“Verify Server”可以验证信息是否填写正确,如果正确会跳出一个窗口提示你云盘上还没有 zotero 这个文件夹,问你要不要新建一个,选择“create”即可。
- ZotFile Preferences 的设置:选择第一项
Attach stored copy of files 。
方式二
PDF 文件链接保存在 Zotero 的 Storage 文件夹里 (乱码的子文件夹名称),PDF 原始文件保存在云同步文件夹里,用第三方云同步软件进行同步(GoogleDrive,坚果云客户端,OneDrive),此方法需要下载客户端。可以看到,我前面使用的就是这种方法。 具体过程如下:
File Syncing 的设置:这个地方勾选的话,仅会在 WebDAV 上存储 PDF 链接(虽然这么说,但是在我目前使用中的,这里仅存放了对应于storage 中特定条目的文件夹的.prop 和.zip 文件,后者中会存放一些截图)。Zotero Preferences->Advanced->Files and Folders 里的Linked Attachment Base Directory 和ZotFile Preferences->General Settings 里的Location of Files 的文件夹路径都设置为云同步的文件夹。
|