zotero是一款免费易用的开源文献管理工具。有时候为了更方便的分享文献,需要将某个文献集合(分类)中条目所关联的PDF文件导出来。文献少的时候尚可逐个手动导出,但对于大量文献的情况,zotero目前并不支持批量导出功能。本文提供一个python批处理脚本来解决这一问题。
脚本的基本原理是利用zotero生成的csv描述文件自动从zotero存储库复制相应的PDF文件,保存到指定的文件夹。
Zotero CSV描述文件的导出方法
导出的csv文件包含每条文献的全部信息,其中的File Attachments字段记录着每条文献所属PDF文件的保存路径,通过脚本遍历该CSV文件即可实现PDF文件的批量导出。
脚本
zoteroPdfExport.py:
import csv
import argparse
import pathlib
import shutil
parser = argparse.ArgumentParser(
description='Copy PDFs from Zotero to the given destination.')
parser.add_argument('-c', '--csv', type=pathlib.Path,
required=True, help='CSV file exported from Zotero')
parser.add_argument('-d', '--dest', type=pathlib.Path,
default='./', help='Destination folder for the PDFs')
args = parser.parse_args()
copySuccess = 0
copyFail = 0
with open(args.csv.absolute(), newline='', encoding='utf-8-sig') as csvfile:
cr = csv.DictReader(csvfile)
for row in cr:
print("Copying... {}".format(row["File Attachments"]))
try:
shutil.copy(row["File Attachments"], args.dest.absolute())
copySuccess = copySuccess+1
except:
copyFail = copyFail + 1
print("Done. {} Succeed, {} Failed.".format(copySuccess, copyFail))
脚本使用方法
python ./zoteroPdfExport.py -c xxx.csv -d ./pdfs
参数:
- -c (--csv) 从zotero导出的分类描述文件(csv格式)
- -d (--dest) PDF文件的目标路径,默认为当前文件夹
参数说明详见:
python ./zoteroPdfExport.py --help
|