Spotkanie z danymi

Dane badawcze to tajemniczy termin, który przez ostatnie lata wszedł z dużym impetem do dyskursu o humanistyce cyfrowej i humanistyce w ogóle. Dla rodzimego środowiska literaturoznawców było  – zarówno pojęcie, jak i jego desygnat – dosyć tajemnicze i nakładające na badaczy niejasne, a niepokojące obowiązki udostępniania czy deponowania tego niejasnego „czegoś”[1]). Sprawy nie ułatwiał fakt, że przy niejasnym desygnacie tego, co jest danymi np. w literaturoznawstwie, na plan pierwszy wysuwał się w odbiorze postulat publikowania notatek badawczych, co budziło zrozumiały opór badaczy, ale przede wszystkim rozmywało istotę zagadnienia. Gdy dodać do tego tajemnicze FAIR i jego pochodne (jak fairyfikacja danych) – skala rozminięcia się narracji o tej kwestii z jej istotą zdawała się przebijać skalę.

Swoje doświadczenie z danymi zacząłem z dużą dozą sceptycyzmu, prowadzącego do błędnego przeświadczenia, że dla literaturoznawstwa cyfrowego, zwłaszcza w uprawianych przez mój zespół odmianach, jest to kwestia marginalna, prawdopodobnie w ogóle pomijalna.

Kwestia nie była zresztą taka oczywista i w humanistyce zachodnioeuropejskiej – m.in. z tego względu urządzano spotkania i warsztaty, mające na celu dopracowanie tej kwestii. Na jedne z takich warsztatów, organizowane przez sieć CO-OPERAS, zostałem wydelegowany przez moich współpracowników z kierownictwa CHC i wybrałem się do Brukseli. Wyekwipowany zostałem w świeżo powstały wówczas raport dotyczący danych w humanistyce[2] oraz kilka prezentacji naszych europejskich współpracowników.

Na spotkaniu, w którym uczestniczyli przedstawiciele najróżniejszych dyscyplin humanistycznych[3], zaangażowani w kwestie cyfrowe w różnym stopniu i na różne sposoby oraz z najróżniejszymi poziomami doświadczeń, zrozumiałem dwie rzeczy. Po pierwsze – różnice w postrzeganiu kwestii cyfrowych (w tym przypadku: danych) i wyzwań, które się z nimi wiążą są często niezwykle mocno powiązane z dyscyplinami badawczymi. Dla nauk społecznych na przykład często najważniejszym problemem są dane wrażliwe i zakres ich dostępności oraz przetwarzania. Dlatego też musimy mocno zastanowić się, niejako sami dla siebie, jak widzimy dane w naszej, literaturoznawczej dziedzinie. Po drugie  – uświadomiłem sobie, że jednak w projektach, które realizuję, istnieje sporo zasobów, które mogą zostać uznane za dane. Należy tylko na nie spojrzeć z odpowiedniej perspektywy.

Zaczęliśmy więc w ówczesnym kierownictwie CHC sprawę drążyć, czego efektem były najpierw zorganizowane jesienią 2020 zdalne warsztaty o danych w humanistyce, później wspólny obszerny artykuł zbierający wiedzę o danych i dopasowujący ją do literaturoznawstwa[4].

Rozwijając dyskusję i refleksję  związaną z danymi w humanistyce zaangażowaliśmy się się w działania grupy roboczej DARIAH o nazwie “Research Data Management”[5], która zgromadziła osoby różnych dyscyplin i profesji (od data stewardów do badaczy), by wymieniać się doświadczeniami. Dzięki finansowaniu z DARIAH udało się w czerwcu 2022 przeprowadzić sprint pisarski, podczas którego członkinie i członkowie grupy tworzyli raport o stanie kwestii danych w europejskiej humanistyce. Po kilku miesiącach prac redakcyjnych został on opublikowany[6] i stanowi dokument przydatny dla każdego, kto chciałby zapoznać się z zagadnieniem danych badawczych.

Przy okazji  stworzyliśmy także kilka planów zarządzania danymi badawczymi, które w praktyce pokazały, jak zastosować zasady opisane przez nas do konkretnych projektów[7].

Podsumowując zatem – literaturoznawca, który chciałby dowiedzieć się, jakie może mieć dane i co z nimi robić, dysponuje dziś wieloma przydatnymi wskazówkami. Byłoby znakomicie, gdyby z nich korzystał i starał się w praktyce wdrażać zasady FAIR (choć nie zawsze gdy dochodzimy do „I” oraz „R” jasne jest, jak to uczynić), a także na poważnie traktował kwestie zagadnienie danych w projektach. Tym, którzy chcieliby zostać „literatoroznawcami bardziej cyfrowymi”, sugerowałbym dokładniejsze zgłębienie się w tę kwestię, i zapoznanie z większością przywołanych w tym fragmencie dokumentów: wszystkie z nich można czytać w wolnym dostępie. Kwestia danych pojawia się w kilku kontekstach w naszej monografii. Zainteresowanych tymi zagadnieniami zachęcam do ich lektury oraz przywołanych w nich pozycji bibliograficznych.

Przypisy

  1. Jak trochę prześmiewczo, ale dosyć celnie pisał Martin Paul Eve: Innym wyzwaniem jest to, że termin „dane” w rzeczywistości oznacza „coś” [The other challenge is that the term ‘data’ actually means ‘stuff ’]MARTIN PAUL EVE, The Digital Humanities and Literary Studies,Oxford University Press 2022,  s.24]
  2. https://allea.org/portfolio-item/sustainable-and-fair-data-sharing-in-the-humanities/
  3. Sprawozdanie z warsztatów: https://zenodo.org/records/3999360/files/CO-OPERAS_FAIRdata_wksp_Brussels_03032020.pdf
  4. Maryl, Maciej, Marta Błaszczyńska, Bartłomiej Szleszyński, and Tomasz Umerle. Dane badawcze w literaturoznawstwie. „Teksty Drugie. Teoria literatury, krytyka, interpretacja”, 2 (2021), s. 13–44.
  5. Grupa ta współtworzona była i do połowy 2023 roku współkierowna przez Martę Błaszczyńską – koordynatorkę, a później członkinię kierownictwa CHC https://www.dariah.eu/2020/04/16/new-dariah-working-group-on-research-data-management/
  6. Erzsébet Tóth-Czifra, Marta Błaszczyńska, Francesco Gelati, Femmy Admiraal, Mirjam Blümm, Erik Buelinckx, Vera Chiquet, i in. „Research Data Management for Arts and Humanities: Integrating Voices of the Community”. Zenodo, 30 sierpień 2023. https://doi.org/10.5281/zenodo.8059626
  7. Na platformie zenodo można zapoznać się ze zdeponowanym tam dokumentem: Błaszczyńska Marta,  Bartłomiej Szleszyński. „Plan zarządzania danymi badawczymi (wersja 1, kwiecień 2023 r.). „Warszawa/Łódź. Atlas literatury zagłady” (2022-2027)”. Zenodo, 5 kwiecień 2023. https://doi.org/10.5281/zenodo.7802002
Spis treści