Il. 15 Tomy kolejnych serii słowników; źródło: oprac. własne

Proces remediacji w praktyce
Marlena Sęczek

Narzędziem wykorzystanym do zbudowania aplikacji słownika Polscy pisarze i badacze literatury XX i XXI wieku była deweloperska platforma bazodanowa InstaDB, stworzona w 2009 roku przez firmę Atinea, która w następnych latach rozwijała i skomercjalizowała oprogramowanie. Użyto tu: jako silnika bazy danych – MySQL, jako serwera HTTP – nginx, jako języka programowania – NianioLang[1]. Realizacji zadania podjęła się firma ImpiCode[2].
Pierwszym etapem wdrażania projektu była budowa back-endu, czyli interfejsu dla zespołu tworzącego słownik. Po zainstalowaniu platformy InstaDB – zgodnie z założeniami opracowanymi wcześniej w zespole dokumentalistów i informatyków – utworzona została baza danych. Pierwsze zadanie polegało na dodaniu interfejsów zarządzania danymi, czyli:

a. Panelu redaktora naukowego;
b. Panelu zespołu autorów słownika.

Następnie dokonano importu danych z zielonego słownika, tj. Polscy pisarze i badacze literatury przełomu XX i XXI wieku, dostępnego w Internecie pod adresem: www.ppibl.ibl.waw.pl. Okazało się to stosunkowo proste. Po automatycznym przeniesieniu ustrukturyzowanych danych i wstępnej walidacji wyników pierwszych trzysta haseł wymagało od zespołu jedynie drobnych poprawek korektorskich.

Znacznie bardziej skomplikowany był proces importu danych ze złotego słownika, tj. Współcześni Polscy pisarze i badacze literatury. Trudności pojawiły się po pierwsze ze względu na objętość źródła (1955 haseł oraz ponad 1500 uzupełnień do nich), po drugie z uwagi na brak poprawnej wersji elektronicznej, po trzecie wreszcie z powodu „rozbicia” większości artykułów hasłowych na hasło główne (w t. 1-9) oraz specyficznie zapisane uzupełnienie (w t. 10). Remediacja złotego słownika przebiegała w związku z tym w kilku etapach.

Przypisy

  1. Więcej zob. instadb.com/pl/dokumentacja.php
  2. Więcej zob. impicode.pl