登录

科学网—惊人数据!超过200万篇学术论文DOI号已失效


速读:今年早些时候,Nature报道了数百万篇研究文章在主要数字档案中消失这一令人担忧的发现。 伦敦大学伯贝克分校研究技术和出版的MartinEve揭露了这一情况。 另一个选择可能是机构和资助机构在发表论文的同时,将文本和数据存档作为研究项目的一项要求。 这个概念最初的设计是为了让至少有一个机构始终拥有每本已出版书籍的公开副本,但在一些国家/地区,它后来扩展到包括研究作品。 但进一步扩展它并不能够提供完善的解决方案,因为以法定存储方式存档的材料不容易被查找到——但这可以作为绝对最低限度的“防线”,以确保即使学术研究的创建者不再支持存档,学术研究的副本也依旧能继续存在。
惊人数据!超过200万篇学术论文DOI号已失效

精选

已有 243 次阅读

2024-12-18 10:27

| 系统分类: 论文交流

今年早些时候, Nature 报道了 数百万篇研究文章在主要数字档案中 消失 这一令人担忧的 发现。 伦敦大学伯贝克分校 研究 技术和出版的 Martin Eve 揭露了这一 情况 。 Eve 对 700 多万篇具有唯一数字对象标识符( DOI )的文章进行了抽样, DOI 是一串用于识别和链接到特定出版物的字符,例如学术文章和官方报告 都拥有自己独一无二的 DOI 号 。 在调查过程中 ,他发现 有 超过 200 万 篇文章“ 丢失 ” —— 也就是说,它们没有 被 保存在确保将来可以找到文献的主要 数字 档案 库 中( M. P. Eve J. Libr. Sch. Commun. 12 , eP16288; 2024 )。 作者: Leste,转载请联系美捷登授权并显著标注来源美捷登。

Eve 还是 Crossref (一个注册 DOI 的组织)的研究开发人员, 他 开展这项研究是为了更好地了解 一个在 图书馆员和档案员 中已经达成共识的问题 ,即尽管研究人员以前所未有的速度 创造 知识,但这些知识 却 不一定 都 能被安全 长久 地 存档 以备将来使用。促成因素 之一 是并非所有期刊或学术团体都能永久存在。例如, 2021 年的一项研究发现,缺乏全面和开放的存档意味着 174 种开放获取期刊 的内容—— 涵盖所有主要研究主题和 所处 地理区域,在本千年的头二十年 里 从网络上消失了 ( M. Laakso et al. J. Assoc. Inf. Sci. Technol. 72 , 1099–1112;2021 ) 。

缺乏长期存档尤其影响低收入和中等收入国家的机构、富裕国家较不富裕的机构以及全球规模较小、资源不足的期刊。然而,目前尚不清楚研究人员、机构和政府是否已经完全接受了这个 情况 。 “ 保存是每个人都会指出 的 问题,但这 并 不是一个容易解决的问题 。” 维尔纽斯的非营利组织 Electronic Information for Libraries 的开放访问项目经理 Iryna Kuchma 说 。 该组织旨在改善人们对数字信息的访问 体验 。 作者: Leste,转载请联系美捷登授权并显著标注来源美捷登。

“ 越来越多的期刊正在建立,而制衡机制越来越少, ” 总部位于伦敦的 Crossref 首席项目官 Ginny Hendricks 说 ,“ 有一些大出版商,他们做得还不错,但世界上有一半的期刊都是小本经营,他们需要花钱才能从 存档数据库 获得某种服务 。”

问题的核心是缺乏资金、基础设施和专业知识来 保存 数字资源。 “ 数字保存成本高昂,而且相当困难, ” 全球学术档案网络开放获取存储库联合会的执行董事 Kathleen Shearer 表示,“ 这不仅仅是创建事物的备份副本 ,而 是在快速发展的技术环境中 , 随着时间的推移对内容进行主动管理。 ”

对于负担得起的机构, 其中 一种解决方案是支付 服务公司 存档费来保 存 内容。例如,位于纽约市的 Portico 和位于加利福尼亚州斯坦福的 CLOCKSS ,这两家公司的客户 中就有 众多出版商和图书馆。

但是,当资金紧张时,存档通常不会被优先考虑, 特别是 对于资源匮乏的 小型 出版商来说。 “ 这是一个更大的挑战,因为很多期刊 公司 都很小, 且自身 没有强大的平台和保存服务基础设施, 要 面临的风险更大 。 ”Portico 的董事总经理 Kate Wittenberg 说。

另一个选择可能是机构和资助机构在发表论文的同时,将文本和数据存档作为研究项目的一项要求。至少,这将意味着在有 此类 设施的情况下, 确保 将 研究 存入机构 数据档案 库。 即 ,强制存档将迫使研究人员和他们的资助机构努力思考并找到满足存档要求的解决方案。

将存档设为强制性也将鼓励尚未运营自己 数据档案 库的大学 尽快 建 设 。 “ 大学是我们社会中最持久 存在 的 设施 之一, ” 南非开普敦大学的数字图书馆学者 Hussein Suleman 说 ,“ 如果我们 充分利用 它 们 ,这将成为我们这一代人知识的保护机制,以便子孙后代能够获取 这些知识 。 ”

除此之外的 选择是让更多国家实施 “ 法定 数据档案 库 ” —— 作者或出版商有义务将新作品存入的关键 数据 库。这个概念最初的设计是为了让至少 有 一个机构始终拥有每本已出版书籍的公开副本,但在一些国家 / 地区,它后来扩展到包括研究作品。 但 进一步扩展它 并不能够 提供 完善 的解决方案,因为以法定 存储 方式存档的材料 不容易被查找到 —— 但 这 可以作为绝对最低限度的 “防线” ,以确保 即使 学术研究的创建者不再支持存档,学术研究的副本 也依旧能 继续存在。

增加人们获取知识的途径和增加新研究的可见性是全球研究出版政策的焦点。存档是其中的核心,也是学术研究本身的核心。正如 Eve 在 3 月份告诉 Nature 的那样: “ 我们的整个科学和研究认识论都依赖于脚注链 接 。 ” 如果对这些知识的访问变得更加受限,幸存下来的研究将由机构主导,例如欧洲和美国的机构,这些机构有资金保 存 他们 数据档案库 中的研究。 全世界 必须 从现在就 采取行动,确保 任何 个人、任何地方的学术研究的记录 都 可以永久存 续 。

作者:Leste,转载请联系美捷登授权并显著标注来源美捷登。

参考资料: https://www.nature.com/articles/d41586-024-03842-z

转载本文请联系原作者获取授权,同时请注明本文来自Medjaden美捷登科学网博客。 链接地址: https://blog.sciencenet.cn/blog-475824-1464717.html

上一篇: “翰笔计划医学中青年编辑”华誉-美捷登专项科研项目结题会取得圆满成功

主题:研究|惊人数据