Wie fange ich mit dem Forschungsdaten-Management an? Datensicherung und strukturierte Dateiablage

Unabhängig davon, ob Forschungsdaten im Rahmen eines Forschungsprojekts veröffentlicht werden, macht es Sinn, sich Gedanken zur Datensicherung und -ablage zu machen. So verringern Sie das Risiko eines Datenverlustes und finden sich besser zurecht.

 

Datensicherung und Backup: Drei Kopien Ihrer Daten auf zwei unterschiedlichen Medien, eines davon an einem externen Ort

Backups und Sicherungskopien Ihrer Arbeitsdateien sind essentiell, um sich vor Datenverlust zu schützen. Schnell ist eine Festplatte kaputt gegangen oder das Laptop mit dem fast fertigen Artikel gestohlen worden. Es empfiehlt sich daher sehr, von Dateien auf Ihrem Arbeitsrechner eine Kopie auf einer externen Festplatte oder einem USB-Stick, der an einem anderen Ort liegt, zu haben, sowie zusätzlich Online-Dienste zu nutzen. Viele Universitäten und Rechenzentren bieten beispielsweise Cloudspeicher an. Netzlaufwerke des eigenen Instituts/Lehrstuhls eignen sich ebenso. Daneben gibt es auch eine Vielzahl an kommerziellen Diensten wie beispielsweise Dropbox. Diese können auch genutzt werden, wobei vertrauliche und/oder sensible Daten diesen Anbietern aus Datenschutzgründen nicht anvertraut werden sollten.[1]

 

Dateibenennung und -ablage

Einheitliche Konventionen zur Dateibenennung und zu deren Ablage erleichtern das Zurechtfinden in Ihren Daten ungemein. Diese Regeln können zum Beispiel wie folgt aussehen:

  • Einheitlicher Aufbau von Ordner- und Dateinamen. Halten Sie sich an ein einmal festgelegtes System. Überlegen Sie sich eine klare Ordnerhierarchie. Diese sollte nicht zu verschachtelt sein, nicht zu viele Ebenen umfassen und die Ordnernamen sollten Aussagekräftig benannt werden.
  • Nutzen Sie beschreibende Dateinamen wie Fotos_Archiv_XY_Datum oder Messreihe_XY_Datum. Zur automatisierten Umbenennung von Dateien gibt es Programme wie z.B. Renamit oder Renamer.[2]
  • Nutzen Sie keine Sonderzeichen wie . ? = % & §.
  • Für Worttrennungen nutzen Sie am besten den Unterstrich _.
  • Versionieren Sie Ihre Dateien, beispielsweise nach dem System v01 (Version 0.1).
  • Geben Sie, soweit sinnvoll, ein Datum nach dem Format JJJJMMTT an. Dies erleichtert die Zuordnung und ermöglicht die chronologische Sortierung bei mehreren Dateien.
  • Bei Forschungsprojekten mit mehreren Mitarbeiter*innen bieten sich Namenskürzel an.
  • Beispiel für eine Dateibenennung: Forschungsdaten_Erhebung_Tschechien_20190823_v01_AS.odt
  • Halten Sie Ihre Konventionen zur Dateibenennung und -ablage fest, etwa in einem Datenmanagementplan!
  • Bei Erhebungsdaten in Tabellen oder Datenbanken bietet es sich an, in Readme-Dateien im Ablageordner kurz zu beschreiben, welche Daten in den Dateien enthalten sind und zu erläutern, wofür einzelne Feldnamen oder Abkürzungen stehen.

 

Weitere Informationen:

 

Empfehlungen zu Dateiformaten

Nicht alle Dateiformate eigenen sich gleichermaßen für die Archivierung von Forschungsdaten. So ist es unwahrscheinlich, dass wenig gebräuchliche Dateiformate in zehn oder 20 Jahren noch les- und nutzbar sein werden. Bei Dateiformaten, die exklusiv bei einem kommerziellen Anbieter Anwendung finden, besteht ebenfalls die Gefahr, dass die Firma den Support für das Dateiformat nicht langfristig sicherstellen kann.

Es empfiehlt sich daher stark, solche Dateiformate und dazugehörige Software zu nutzen, welche über eine breite Nutzerbasis verfügen und, wenn möglich, offene, standardisierte Dateiformate verwenden.

Unter den folgenden Links finden Sie zusätzliche Informationen zu Dateiformaten sowie Empfehlungen zu diesen:

 

Forschungsdaten mit Metadaten beschreiben

Metadaten sind Daten, die andere Daten beschreiben. Bekannt sind Ihnen sicherlich die Titelangaben in Bibliothekskatalogen, welche Metadaten zu Büchern darstellen.

Die Hauptaufgabe von Metadaten bei der Beschreibung von Forschungsdaten ist es, diese recherchier- und nachvollziehbar zu machen. Gängige Metadatenstandards enthalten dementsprechend zum einen bibliographische Angaben wie den Titel, Veröffentlichungszeitpunkt oder Name des/der Ersteller*in. Zum anderen umfassen sie nähere Angaben zu den Inhalten der Forschungsdaten, etwa in Form eines Abstracts, Beschreibung der angewandten Methoden oder des Themas.

Ausführlich beschrieben wird das Thema Metadaten hier:

Kontaktieren Sie uns, wenn Sie Fragen zu einem geeigneten Metadaten-Schema für die Beschreibung Ihrer Forschungsdaten haben.

 


Fußnoten

[1] Siehe z.B. http://kb.mit.edu/confluence/x/Z3kYCQ, am 19.11.2019.

[2] Beispiele für Software zum automatisierten Umbenennen für Windows: "Rename It" https://sourceforge.net/projects/renameit/ oder "Renamer" http://www.antp.be/software/renamer und für Mac "NameChanger" https://mrrsoftware.com/namechanger/.

 

 

Kontakt

* Pflichtfeld