Aktuelles im Detail

Interview: Warum wir das Risiko bei der Bewahrung digitaler Daten neu denken müssen

© ECDF/PR/Felix Noak

Als Gesellschaft erzeugen wir eine ständig wachsende Menge an Daten. Von historischen Sammlungen und staatlichen Archiven bis hin zu wichtiger wissenschaftlicher Forschung werden riesige Datenmengen in digitalen Repositories auf der ganzen Welt gespeichert. Die digitale Bewahrung ist ein immer wichtigeres Thema, und ohne eine Bewahrungsplanung laufen wir Gefahr, wichtige Daten im Falle einer Katastrophe oder in häufigeren Szenarien zu verlieren, z. B. bei einem raschen technologischen Wandel oder wenn ein Unternehmen seine Geschäftstätigkeit aufgibt. Im Interview mit Elsevier erläutert ECDF-Professorin Rebecca D. Frank die Bedeutung der Kontinuität von Forschungsdaten und wie sie erreicht werden kann. Das Interview führte Libby Plummer von Elsevier. 

 

"Ganz gleich, ob es sich um Daten handelt, die 'digital geboren' wurden, oder um digitalisierte Surrogate physischer Objekte, die Informationen selbst mögen klein erscheinen, aber was wirklich wichtig ist, ist, dass selbst eine sehr kleine Datei eine enorme Menge an Geld, Zeit und Ressourcen darstellen kann", sagte Prof. Rebecca D. Frank vom Einstein Center Digital Future kürzlich in einem Webinar für Elsevier-Mitarbeiter. "Deshalb ist es wichtig, nicht nur darüber nachzudenken, wie man sich um diese Daten kümmert, sondern wirklich zu verstehen, wie man ihr Überleben langfristig sichern kann."

Es ist wichtig, dass wir den Organisationen, die als Hüter wichtiger Forschungsdaten fungieren, vertrauen können, weshalb sie sich im Rahmen eines strengen Prüfungsprozesses einer Zertifizierung unterziehen. Es werden Nachfolgepläne für Repositorien entwickelt, um die Kontinuität der Daten auch dann zu gewährleisten, wenn die primäre Speichermethode auf irgendeine Weise ausfällt, z. B. wenn eine Organisation geschlossen wird. Aber tun wir auch genug, um die mit der digitalen Bewahrung verbundenen Risiken zu verstehen und abzumildern? Rebecca ist der Meinung, dass wir noch einen weiten Weg vor uns haben:

 

"Bei der digitalen Bewahrung haben wir hervorragende Arbeit geleistet, wenn es darum geht, die Risiken in technischer, wirtschaftlicher und organisatorischer Hinsicht zu betrachten", sagt sie. "Es ist an der Zeit, diese Liste um soziale Aspekte zu erweitern.

 

Am Einstein Center Digital Future, wo sie von Elsevier gesponsert wird, forscht Rebecca in den Bereichen offene Daten, digitale Kuratierung und Bewahrung sowie Datenwiederverwendung, mit dem Schwerpunkt, wie soziale und ethische Barrieren die langfristige Bewahrung digitaler Informationen beeinflussen. Sie ist außerdem Juniorprofessorin für Informationsmanagement an der Berlin School of Library and Information Science der Humboldt-Universität zu Berlin und Mitarbeiterin des Humboldt-Elsevier Advanced Data and Text Centre (HEADT Centre), das sich auf Forschungsintegrität und Bildung konzentriert.

Rebeccas aktuelle Forschungsarbeit untersucht die soziale Konstruktion von Risiken im Zusammenhang mit der Prüfung und Zertifizierung von digitalen Repositorien. Ihr Interesse an Risiken und digitaler Bewahrung begann mit einer früheren Studie zur Katastrophenplanung. 

"Ich habe herausgefunden, dass Repositorien, die sich als vertrauenswürdig zertifizieren lassen wollten, eher über dokumentierte Katastrophenpläne verfügten, weil diese Dokumentation natürlich für die Zertifizierung erforderlich ist. Diese Studie hat mir auch verdeutlicht, dass es bei der digitalen Bewahrung und der Zertifizierung vertrauenswürdiger Repositorien um Risiken geht."
 

Rebeccas nächste Forschungsrunde konzentrierte sich auf eine der drei bekanntesten Zertifizierungen für Data Preservation, die heute verwendet werden - die ISO 16363-Zertifizierung, die gewöhnlich als TRAC (Trustworthy Repositories Audit & Certification) bezeichnet wird. Ihre Untersuchungen ergaben, dass die an diesem Prozess Beteiligten dazu neigen, sich auf einen klassischen Risikoansatz zu verlassen, der sich auf die Wahrscheinlichkeit eines Ereignisses, multipliziert mit dem Ausmaß seiner Folgen, konzentriert. Diese Risikobetrachtung setzt jedoch erstens voraus, dass wir Bedrohungen erkennen können, und zweitens, dass Menschen auf Risikoinformationen mit vorhersehbarem Verhalten reagieren werden. Wie Rebecca erklärte:
 

"Dieser Ansatz bringt uns nicht weiter, und hier kommt meine Forschung ins Spiel. Wir wissen, dass Menschen keine vollkommen rationalen Akteure sind und dass soziale Faktoren die Art und Weise beeinflussen, wie sie alle Arten von Informationen erhalten, verstehen und auf sie reagieren, einschließlich Informationen über Risiken. Um die Langlebigkeit digitaler Informationen zu gewährleisten, kommt es also darauf an, wie die Menschen auf Informationen reagieren. Und ich behaupte, dass soziale Faktoren die Art und Weise beeinflussen, in der Akteure, die an der Zertifizierung von Repositorien und der digitalen Bewahrung beteiligt sind, den Kontext von Risiken verstehen."
 

Vor dem Hintergrund dieser Faktoren entwickelte Rebecca ein theoretisches Modell für die soziale Konstruktion von Risiken bei der digitalen Bewahrung. Mit dem Schwerpunkt auf dem TRAC-Zertifizierungssystem untersuchte sie dann, wie Auditoren und Repository-Manager Risiken im Rahmen eines Audits konzeptualisieren, welche Unterschiede und Gemeinsamkeiten es zwischen ihrem Risikoverständnis und der Risikokommunikation gibt. Sie untersuchte auch, inwieweit die Faktoren in ihrem Modell die Risikowahrnehmung beeinflussen.

Sie stellte fest, dass Prüfer und Standardentwickler auf der einen Seite und Repository-Mitarbeiter auf der anderen Seite nicht dasselbe Risikoverständnis haben. So stellte sie beispielsweise fest, dass die Repositorien zwar glaubwürdige Nachfolgepläne vorlegten, ihre Mitarbeiter jedoch nicht unbedingt der Meinung waren, dass diese Pläne ein Beweis dafür waren, dass die Risiken vollständig berücksichtigt wurden. Die Teilnehmer argumentierten auch, dass diese Pläne möglicherweise nicht durchsetzbar sind, da sie nur in Kraft treten würden, wenn ihre eigene Organisation scheitert.

Diese Nachforschungen führten Rebecca zu ihrem aktuellen Projekt, das sich auf das CoreTrustSeal-Zertifizierungssystem konzentriert - eine Kombination aus zwei älteren Zertifizierungssystemen (Data Seal of Approval und World Data Systems), die globaler angelegt sind als TRAC. Im Rahmen des CoreTrustSeal-Systems sind die Prüfer und die Mitarbeiter des Repositoriums keine getrennten Gruppen mehr. Vielmehr setzt sich die Gruppe der Auditoren aus Vertretern der zertifizierten Repositorien zusammen.
 

"Ich bin sehr daran interessiert zu sehen, was passiert, wenn die beiden Gruppen, die sich in meiner vorherigen Studie nicht einig waren, nicht mehr in getrennten, unterschiedlichen Gruppen sind", sagte Rebecca. "Das Ziel dieser Studie ist es, ähnlich wie bei der vorherigen Studie, zu verstehen, wie die Beteiligten in diesem Prozess ihr Risikoverständnis konstruieren.
 

Rebecca führt nun Interviews durch und sammelt Dokumente für die weitere Analyse. Während ihre frühere Untersuchung ergab, dass die Entwickler von Standards und die Prüfer der Meinung sind, dass Repositories Vertrauenswürdigkeit demonstrieren, sehen die Mitarbeiter der Repositories den Prozess eher als performativ an. Die vorläufigen Ergebnisse der aktuellen Untersuchung deuten darauf hin, dass dies nicht der Fall ist, so dass in einem nächsten Schritt untersucht werden soll, warum das so ist. Aber was bedeutet dies im weiteren Kontext der digitalen Bewahrung? "Es bedeutet, dass wir Risiken identifiziert und dokumentiert haben, wie wir auf sie reagieren werden - aber wir haben nicht wirklich berücksichtigt, dass die Menschen sich nicht auf die gleiche Weise verhalten werden", so Rebecca.

Diese Forschungsergebnisse legen nahe, dass wir die Art und Weise, wie wir die digitale Bewahrung angehen und wie wir entscheiden, wer in der Lage ist, sich um solch wichtige Daten zu kümmern, verbessern müssen", erklärte sie. Insbesondere müssen wir die Faktoren, die das Risiko und damit die Zuverlässigkeit von Datenspeichern und deren Zertifizierung beeinflussen, genauer unter die Lupe nehmen. Obwohl Rebecca in ihrer Arbeit Zertifizierungssystemen zwangsläufig sehr kritisch gegenübersteht, ist sie der Meinung, dass sie die Vertrauenswürdigkeit von Repositories erhöhen, auch wenn die derzeitigen Verfahren nicht perfekt sind. "Ich glaube, dass die Repositories durch den Zertifizierungsprozess besser geworden sind", sagt sie.

Diese Ansicht über die Bedeutung der Zertifizierung wird von Elsevier-Kollegen geteilt, die mit mehreren Organisationen für die Datenerhaltung zusammenarbeiten, darunter CLOCKSS. Gwen Evans, VP of Global Library Relations bei Elsevier und Mitglied des CLOCKSS-Beirats, sagte:
 

"Elsevier engagiert sich sehr für die dauerhafte Verfügbarkeit und Bewahrung wissenschaftlicher Daten, damit sie auch zukünftigen Forschern zugute kommen. Wir arbeiten mit Bibliothekaren und anderen Verlagen über vertrauenswürdige Partner wie Portico, CLOCKSS, DANS (Data Archiving and Networked Services) und die Nationalbibliothek der Niederlande zusammen, um unsere Inhalte zu hinterlegen. Dies erfordert kontinuierliche Ressourcen und das Engagement aller Beteiligten hinter den Kulissen, um sicherzustellen, dass die Inhalte geschützt und verfügbar sind, unabhängig davon, wie sich die Zugangstechnologie in Zukunft entwickelt."
 

Was kommt als Nächstes?
Es ist klar, dass digitale Repositories und Zertifizierungen für die Bewahrung von Daten unerlässlich sind und dass wir immer wieder neu prüfen müssen, wie wir das damit verbundene Risiko definieren. Wie geht es also weiter? Nach Abschluss ihrer aktuellen Forschungsarbeit plant Rebecca, sich eingehender mit den Ungleichheiten zu befassen, die innerhalb der Datenbewahrungsgemeinschaft bestehen:

"Langfristig möchte ich darüber nachdenken, wie das Risiko bei Repositories aufgebaut ist, die ihre Vertrauenswürdigkeit nachweisen wollen, aber keinen formalen Audit-Prozess durchlaufen können. Alle diese Verfahren sind zeit- und kostenaufwändig, und die zertifizierten Repositorien befinden sich größtenteils in gut finanzierten Einrichtungen im globalen Norden. Ich bin sehr daran interessiert, wie sich das alles in Organisationen mit weniger Ressourcen auswirkt."