Studie zur Digitalisierung von wissenschaftlichen Zeitschriften

Darum verschwinden Millionen Forschungsarbeiten aus dem Internet

Der Zugang zu einem großen Teil der Forschung ist gefährdet, wenn ein Verlag verschwindet: Eine Analyse von 7,5 Millionen wissenschaftlichen Arbeiten zeigt, dass die digitale Langzeitarchivierung bei vielen Publikationen nicht sichergestellt ist.

Mehr als ein Viertel (28 Prozent) der wissenschaftlichen Artikel werden nicht ordnungsgemäß archiviert und aufbewahrt, warnen die Autoren einer Studie, die im Journal of Librarianship and Scholarly Communication veröffentlicht wurde. Ihre Untersuchung deutet darauf hin, dass die Systeme zur Online-Aufbewahrung von Publikationen nicht mit dem Wachstum der Forschungsergebnisse Schritt gehalten haben.

„Unsere gesamte Epistemologie von Wissenschaft und Forschung beruht auf der Kette von Fußnoten“, sagte Autor Prof. Martin Eve, Forscher für Literatur, Technologie und Verlagswesen an der Birkbeck University of London, dem Wissenschaftsmagazin Nature. „Wenn du nicht verifizieren kannst, was jemand anderes an einer anderen Stelle gesagt hat, vertraust du nur auf blinden Glauben an Artefakte, die du selbst nicht mehr lesen kannst.“

Ein Viertel der Arbeiten wird nicht sicher archiviert

Eve, der auch an der Forschung und Entwicklung der Digital-Infrastruktur-Organisation Crossref beteiligt ist, überprüfte in seiner Studie für 7.438.037 mit DOIs gekennzeichnete Arbeiten, in welchen Archiven sie aufbewahrt werden. Die DOIs dienen zur eindeutigen Identifizierung eines Werks und zur Verknüpfung mit bestimmten Publikationen, zum Beispiel wissenschaftlichen Artikeln und offiziellen Berichten. Crossref ist wiederum die größte DOI-Registrierungsagentur, die die Identifikatoren an etwa 20.000 Mitglieder vergibt, darunter Verlage, Museen und andere Institutionen.

Die Stichprobe setzte sich aus einer zufälligen Auswahl von bis zu 1.000 DOIs pro Crossref-Mitgliedsorganisation zusammen. Ergebnis: Mehr als zwei Millionen Studien der Stichprobe (27,6 Prozent) erschienen nicht in einem großen digitalen Archiv, obwohl es einen aktiven DOI gab, und 58,3 Prozent der referenzierten Werke wurden in mindestens einem Archiv aufbewahrt. 14 Prozent der DOIs wurden von der Studie ausgeschlossen, weil die Werke zu spät veröffentlicht wurden, keine Zeitschriftenartikel waren oder keine identifizierbare Quelle hatten.

Auch wenn Eve einräumt, dass seine Studie nur den Verbleib von Artikeln mit DOI verfolgte und nicht jedes digitale Repositorium nach Artikeln durchsuchte, begrüßten Spezialisten für digitale Langzeitarchivierung die Analyse, weil sie aus ihrer Sicht ein sich verschärfendes Problem benennt. „Verlage und Bibliotheken sind Vorreiter bei der digitalen Langzeitarchivierung.  Wir plädieren seit Jahren für dringende Investitionen, um sicherzustellen, dass die Forschung trotz der schwankenden Entwicklung der Verlagsbranche überlebensfähig bleibt”, sagt etwa William Kilbride, Geschäftsführer der Digital Preservation Coalition (DPC) mit Sitz in Glasgow, Schottland. Die DPC verfolgt seit Jahrzehnten das Ziel, einen universellen Ansatz für die digitale Langzeitarchivierung schaffen. Doch auch mehr als 20 Jahre später gibt es keine Lösung.

Jede fünfte klinische Studie wird nie veröffentlicht

Die Ergebnisse von mehr als ein Fünftel der 2016 bis 2019 in Dänemark, Island, Finnland, Norwegen und Schweden durchgeführten klinischen Studien wurden nie veröffentlicht. Damit gingen die Resultate aus 475 klinischen Studien verloren, an denen fast 84.000 Personen teilnahmen, schreiben die Forschenden einer neuen Arbeit und beklagen, dies sei eine Verschwendung von öffentlichen Fördergeldern, schade Patienten und untergrabe die öffentliche Gesundheit.

Die Studie hatte für 2.113 in den fünf Ländern durchgeführte klinische Studien überprüft, ob und wenn wann deren Ergebnisse veröffentlicht wurden. Nur 1.638 Arbeiten (77,5 Prozent) wurden veröffentlicht, innerhalb der ersten zwei Jahre nach Durchführung waren es nur 1.092 Arbeiten (51,7 Prozent). Im Median dauerte es nach der Durchführung 698 Tage bis zur Veröffentlichung. Bei zwei Prozent der klinischen Studien erschienen nur Abstracts.

Das Problem ist offensichtlich nicht auf die nordischen Länder beschränkt: Bereits 2021 hatte ein im Journal of Clinical Epidemiology veröffentlichter Bericht [Riedel et al., 2021] gezeigt, dass 30 Prozent der 1.658 zwischen 2014 und 2017 abgeschlossenen deutschen Studien auch fünf Jahre nach deren Abschluss noch nicht veröffentlicht waren.

Die Studie:
Gustav Nilsonne et al.: Results reporting for clinical trials led by medical universities and university hospitals in the Nordic countries was often missing or delayed, ­medRxiv 2024.02.04.24301363; doi: doi.org/10.1101/2024.02.04.24301363

„Ein Teil des Problems scheint darauf zurückzuführen zu sein, dass Verlage sich nicht darüber im Klaren sind, dass die digitale Bewahrung in ihrer Verantwortung liegt und dass kleinere Verlage mit geringeren Einnahmen tendenziell weniger robuste Bewahrungskulturen haben", sagt Eve. Was darauf hindeute, dass die ungleiche Vermögensverteilung in der wissenschaftlichen Verlagsbranche mit einigen sehr wohlhabenden Häusern, vielen verarmten und wenigen dazwischen die eigentliche Bedrohung ist.

2000 bis 2019 verschwanden 174 Open-Access-Zeitschriften

Wie schwierig die Bewahrung wissenschaftlicher Arbeiten durch die Verlagerung hin zum digitalen Publizieren, insbesondere mit der Einführung von Open Access wird, haben Autoren von der Hanken School of Economics in Helsinki, Finnland, bereits vor drei Jahren gezeigt [Laakso et al., 2021]. Sie konnten nachweisen, dass zwischen 2000 und 2019 mindestens 174 Open-Access-Zeitschriften aus dem Internet verschwunden sind. Das Phänomen betraf den Autoren zufolge „alle wichtigen Forschungsdisziplinen und geografischen Regionen“.

Das Problem müsse als ein „fortlaufender Prozess betrachtet werden, der weitergehen wird, wenn wir uns nicht voll und ganz für die Bewahrung der wissenschaftlichen Aufzeichnungen einsetzen“, schreiben sie. Um es zu lösen, bedürfe es „der aktiven Beteiligung der wissenschaftlichen Gemeinschaft als Ganzes und Lösungen, die so vielfältig sind wie die wissenschaftliche Forschung selbst“.

Die DPC hofft derweil auf eine technische Lösung. Im Zweijahresrhythmus lobt sie die „Digital Preservation Awards“ in verschiedenen Kategorien für die besten Arbeiten im Bereich der digitalen Langzeitarchivierung aus. Der Sieger wurden am 16. September auf der internationalen Konferenz für digitale Konservierung (iPres) in Gent gekürt. Explizit mit der Sicherstellung einer Langzeitarchivierung von wissenschaftlichen Arbeiten beschäftigte sich jedoch keines der prämierten Projekte.

Die Studie:
Eve, M. P., (2024): „Digital Scholarly Journals Are Poorly Preserved: A Study of 7 Million Articles”, Journal of Librarianship and Scholarly Communication 12(1). doi: https://doi.org/10.31274/jlsc.16288

Literaturliste

  • Laakso M, Matthias L, Jahn N: Open is not forever: A study of vanished open access journals. J Assoc Inf Sci Technol. 2021; 72: 1099–1112. doi: doi.org/10.1002/asi.24460

Melden Sie sich hier zum zm-Newsletter des Magazins an

Die aktuellen Nachrichten direkt in Ihren Posteingang

zm Heft-Newsletter


Sie interessieren sich für einen unserer anderen Newsletter?
Hier geht zu den Anmeldungen zm Online-Newsletter und zm starter-Newsletter.