近年来,中国科研产出已经跃居世界第一。2018–2020年间,中国平均每年发表40万篇科技论文,占全球研究产出的23.4%,高被引论文的占比更是超过27%(数据来源:The Guardian报道,基于日本NISTP报告)。虽然这个数据仅仅统计了2018-2020年,但考虑到中国的研究体量还在持续增长,我们的科研论文占比只会更高。然而,与我们强大的科研体量相比,中文科技成果和中国科技成果在国际学术传播上均面临瓶颈。
中国在国际开放仓储中的存在感十分不足。目前,中国在ROAR(Registry of Open Access Repositories,开放获取仓储注册表)
上登记的开放仓储不到100家,仅占全球总量的1.6%(2018年,这个比例为2.1%),而且,其中不少仓储已经关闭或转为内部使用。在另外两个国际开放仓储目录上,中国的登记量更小。在OpenDOAR(Directory of Open Access Repositories,开放获取仓储目录)和IRD(International Repository Directory,国际开放存储库目录)上,均只有60余家。对照来看,美国在IRD上的登记量有1100余家,同为亚洲国家的日本有680余家,印度有110余家,均远超中国。这与国内各种类型的机构在建设各类知识存储、特色数据库、特藏库、数据仓储的火热相对比,我们仓储库在国际上的声量和显示度明显偏低。
从语种上看,西班牙语世界有SciELO平台,拉美地区有RedALyC平台,法国学术界依托HAL和OpenEdition平台,它们都通过完善的开放存储库网络和国际登记,通过支持各类开放协议,确保本国语言的学术成果能够被全球读者轻松发现和使用。而我国仓储库的国际化水平整体偏低。许多仓储网站没有提供英文版,或者英文版本过于简略和粗糙,难以满足国际用户的基本需求。在技术层面,不少仓储未能支持诸如OAI-PMH、RSS、SWORD等主流开放协议,导致与国际聚合器和学术搜索引擎的对接能力较差。交互体验也有待改进,检索、导出、API等功能缺失或不完善。整体来看,这些一个个的仓储库是典型的“信息孤岛”,缺少与国内外其他系统的互联互通,无法形成合力推动中文学术成果的广泛传播。此外,多数仓储的国际推广力度不足。这都使得中文开放成果在全球范围内的可见度和影响力受到严重限制。
这,就是今天我们必须直面的“学术传播的中国落差”。没有被发现的开放,等于没有开放。不能在中国的成果和中文的成果在国际学术检索发现中“消失不见”。
COAR(Confederation of Open Access Repositories,国际开放存储库联盟)自2009年成立以来,一直是绿色开放获取路线的主要推动者。他们提出的“下一代仓储库”(Next Generation Repositories),致力于将全球的开放存储库联络起来,并与其他知识网络和出版系统实现互操作与协同,从而打造分布式、全球互联的开放科学基础设施,并部署基于此基础设施的增值服务,包括但不限于是知识资源的发现、访问、注释、维护、共享、质量评估、内容转移、分析、追踪等,从而实现全球学术成果的学界共管与共享。

2024年,COAR启动了全新的国际开放存储库目录IRD(International Repository Directory),目标是构建一个分布式、可信赖、可持续更新的全球性存储库目录(https://ird.coar-repositories.org)。与过去依赖单一团队集中维护的仓储目录不同,IRD采取责任单位制:由不同地区的组织来负责各自区域内的仓储数据更新与核实。登记到COAR IRD不仅仅是“多一个条目”,而是让中国的学术成果融入全球开放科学基础设施的关键一步。它能够:
提升国际可见度:登记后,仓储将被纳入全球目录,便于国际聚合器、学术搜索引擎(如Google Scholar)、OA工具(如Unpaywall)发现。
增强可信度与权威性:被COAR 审核通过并标记“已验证(Verified)”的仓储,更容易赢得国际学界的信任。
促进交流与合作:通过目录,国内外科研人员、图书馆、开放科学组织更容易建立联系与合作。
中国科学院心理研究所潘菽图书馆目前志愿负责中国(含香港、澳门)开放存储库的数据审核,同时,也希望收集更多国内未登记的开放仓储库的信息,提交给COAR。
开放获取(Open Access, OA)不应等同于“花钱发表”。绿色OA(自存档与存储库网络)与金色OA(付费开放出版)是互补关系。一个强健的存储库网络,可以帮助降低昂贵的出版成本,为中国科研建立更可持续的传播渠道。如果只有金色OA,我们每年要付出数以十亿计的出版费用,却无法建立自主的学术传播渠道。
国内还有大量没有在国家注册的开放仓储,我们希望有越来越多的中国开放仓储能在IRD中登记,包括但不限于:
特藏库:保存珍稀文献、手稿、影像等特殊资源。
典藏库:集中保存机构出版物、内部报告、学位论文等成果。
特色或特定领域数据库:面向某一学科、主题或专业方向,收录专业化文献与数据。
机构知识库:高校、科研院所建立的统一成果存档平台,收录论文、数据、项目成果等。
科学数据仓储库:面向科学实验与观测数据,提供数据保存、共享与再利用服务。
只要满足:1,平台可公开访问;2,主要内容开放获取;3,支持OAI-PMH(开放档案计划元数据采集协议)即可。有关IRD的简介请见这里:https://ird.coar-repositories.org/about?lang=en
IRD的登记不适用于单本期刊的网站。如果是国内开放获取期刊,建议去DOAJ登记(https://doaj.org)。
因为IRD目前还没有开通新仓储库提交的页面,我们用问卷星建立了一个在线表格,开放仓储的负责人可以填写这个在线表格,待整理好以后,集中上传到IRD做登记。
在线表格的地址为:https://www.wjx.cn/vm/t2FHQo4.aspx
二维码为:

中国科研已经走在世界前列,但中国开放存储库的国际化还远远落后。这不仅是技术问题,更是学术生态与国家科研影响力的问题。
诚挚呼吁:如果您所在机构有开放存储库,或者您是开放仓储的建设者或负责人,请支持我们,提交仓储的基本数据,登记到COAR IRD。
让中国的开放仓储,与我们的科研产出一样,站上世界舞台。
如果有问题,欢迎联系:
卫垌圻,中国科学院心理研究所潘菽图书馆,weitq@psych.ac.cn