Dane badawcze zebrane w kolekcje (datasets), udostępniane są online w archiwach. Repozytoria danych badawczych są to intencjonalnie stworzone zbiory danych/materiałów powstałych w wyniku badań empirycznych w różnych przedsięwzięciach naukowych lub też zgromadzonych na potrzeby konkretnych projektów badawczych.
Repozytoria danych obejmują materiały uzyskane w rezultacie badań które zostały zorganizowane celowo, odpowiednio uporządkowane, opisane metadanymi i przygotowane do udostępniania.
Archiwizacja ma na celu również ograniczenie kosztów związanych z przechowywaniem danych oraz utrzymanie ich dostępności. Dokonując selekcji danych przeznaczonych do archiwizacji warto zadać sobie pytania:
- Co przechowywać, co wyrzucać?
- Jakie dane chcemy przechowywać po zakończeniu projektu?
- Gdzie zdeponujemy dane do przechowywania długoterminowego?
- Jak długo będziemy je przechowywać?
- Kto będzie miał do nich dostęp i na jakich zasadach?
Aby wyszukać odpowiednie repozytorium możemy skorzystać z baz indeksujących repozytoria:
Re3data – międzynarodowa baza indeksująca repozytoria danych badawczych, umożliwia wyszukiwanie repozytoriów według dziedziny wiedzy oraz kraju, w którym dane repozytorium jest prowadzone. Rejestruje ponad 2000 repozytoriów danych badawczych z całego świata, uwzględnia wszystkie dziedziny nauki.
OpenDOAR - międzynarodowa baza indeksująca biblioteki cyfrowe, repozytoria instytucjonalne i repozytoria danych badawczych. Baza umożliwia wyszukiwanie samych repozytoriów, jak i przeszukiwanie ich zasobów.
Wskazówki ułatwiające wybór repozytorium:
-
Warunki korzystania z serwisu - czy spełnia on nasze wymagania?
-
Długofalowe bezpieczeństwo danych – czy repozytorium jest godne zaufania?
-
Gdzie i na jakich zasadach będą przechowywane nasze dane, w jaki sposób będą zabezpieczone.
-
Zbiór danych powinien spełniać wymogi zasad FAIR: czy repozytorium zapewnia przypisanie naszym zbiorom identyfikatora DOI? Czy jest odpowiednie powiązanie zbioru z jego autorami? Czy opisy zawierają identyfikator naukowca np. numer ORCID?
-
Czy naukowcy z naszej dyscypliny korzystają z tego samego repozytorium, czy jest ono znane wśród badaczy, dobrze widoczne w wyszukiwarkach?
-
Czy repozytorium wspiera używany w naszej dyscyplinie standard metadanych?
-
Trzeba mieć na uwadze, że niektóre repozytoria mogą pobierać opłatę za archiwizację danych – tzw. Data Processing Charge
-
Czy zasoby wybranego przez nas repozytorium znajdują się w bazach indeksujących repozytoria danych badawczych?
Repozytoria danych badawczych dzielimy na:
1. Specjalistyczne
- Protein Data Bank
- Genbank
- Oxford Text Archive
- Polish Social Data Archive
2. Ogólne
- RepOD – repozytorium Otwartych Danych opracowane przez ICM UW. W ramach działań Platformy Otwartej Nauki archiwizuje i udostępnia wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych.
- Zenodo – międzynarodowe repozytorium danych badawczych. Umożliwia naukowcom ze wszystkich obszarów wiedzy proste archiwizowanie i dzielenie się opracowanymi przez siebie danymi badawczymi.
-
Repozytoria danych badawczych NIH – amerykański National Institutes of Health współtworzy i promuje wiele specjalistycznych repozytoriów danych badawczych, spośród których wiele udostępnia tzw. duże dane zebrane w ramach konkretnych projektów.
- Mendeley – wydawnictwo Elsevier, obok rozwijania menedżera bibliografii i portalu społecznościowego Mendeley, umożliwia swoim użytkownikom archiwizowanie i dalsze udostępnianie ich własnych danych badawczych. Moderowane dane zostają opatrzone stosownymi metadanymi oraz nadawany jest im numer DOI.
3. Data journals - czasopisma publikujące dane badawcze lub informacje o zbiorach danych badawczych (ze wskazaniem repozytoriów, w których dane są przechowywane). Niektóre czasopisma dopuszczają też możliwość dołączania danych w postaci Supplementary Material (uzupełnienie systemu repozytoryjnego, nie alternatywa). Informacje na ten temat i wykazy data journals:
- Data Journals Guide
- Open Data Journals
Dodatkowe informacje:
Jak korzystać z zasobów w repozytoriach danych – poradnik ICM