Historia digitalizacji
Krzysztof Opaliński, Patrycja Potoniec

Historia digitalizacji
Krzysztof Opaliński, Patrycja Potoniec

Sporządzona w latach 50. XX wieku baza materiałowa po latach użytkowania zaczęła coraz bardziej przejawiać objawy zużycia. W najbardziej używanych egzemplarzach archiwalnych papier kruszył się już podczas przekładania stron. Rozważano więc różne metody ratowania tego zasobu, by mógł on dalej służyć w pracach redakcyjnych nad słownikiem. Gdy techniki komputerowe zaczęły coraz śmielej wchodzić w świat humanistyki i otwierać przed nim nowe możliwości, naturalną stała się idea przeniesienia bazy tekstów do postaci cyfrowej. Postać papierowego pierwowzoru niejako narzuciła zasadnicze elementy digitalizacji. Pierwsza dekada XXI wieku dała humanistyce możliwość traktowania tekstów jako swoistej bazy danych, o ile będą one w odpowiedni sposób wyposażone w metadane. Standardem w humanistyce stał się format XML, zwłaszcza odpowiednio przygotowany do celów kodowania tekstów zestaw zaleceń TEI (TEI Guidelines) (por. Prinke 2000, s. 120-191). W oparciu o TEI utworzono zestaw tagów pozwalających na kodowanie tekstów XVI-wiecznych, po wdrożeniu którego baza tekstowa słownika stawała się zestawem danych nadających się do maszynowego przetwarzania. W latach 2012-2017 prowadzono prace nad Korpusem polszczyzny XVI wieku. Jednym z podstawowych zadań tego projektu była digitalizacja tekstów z podstawowego kanonu źródeł słownika. W efekcie powstała największa elektroniczna baza tekstów polskich z XVI wieku.

 

Spis treści