Plany rozwoju
Krzysztof Opaliński, Patrycja Potoniec

Plany rozwoju
Krzysztof Opaliński, Patrycja Potoniec

Ograniczenie bazy wyłącznie do tekstów znajdujących się w wykazie źródeł podstawowych Słownika polszczyzny XVI wieku od samego początku nie było intencją jej powstania. W założeniu baza aspiruje do możliwie najpełniejszego repozytorium tekstów XVI-wiecznej polszczyzny przygotowanych w jednolity sposób. Obecnie pracownia rozpoczyna drugi etap prac nad bazą i korpusem. Etap ten zakłada m.in. poszerzenie bazy o wybrane teksty ze zbioru tekstów uzupełniających. Rozwijana natomiast będzie platforma zasobu, która ułatwi dodawanie kolejnych tekstów do bazy w późniejszym czasie.

Niezwykle istotnym elementem bazy tekstów ma się stać dodatkowa warstwa transkrypcji dodana do każdego tekstu transliterowanego. Warstwa ta ułatwi m.in. tworzenie korpusu czy zautomatyzowane przeszukiwanie zarówno poszczególnych tekstów, jak i całej bazy. Możliwa stanie się również analiza stylometryczna tekstów XVI-wiecznych oraz weryfikacja poprawności działania narzędzi stylometrycznych w kontekście analizy tekstów dawnych.

Narzędziem, które pozwoli na pełniejsze i bardziej wyrafinowane wykorzystanie bazy tekstów, będzie wyszukiwarka. Obecnie baza nie oferuje tego typu narzędzia, a ciągi znaków można odnaleźć jedynie w obrębie tekstu aktualnie wyświetlanego w przeglądarce za pomocą wbudowanego mechanizmu wyszukiwania na stronie. W przyszłości ma się to zmienić. Baza będzie wyposażona w wyszukiwarkę działającą na całej bazie, a wyniki wyszukiwania będzie można zawężać na podstawie zadanych kryteriów wykorzystujących metadane i anotację. Wyszukiwarka ponadto będzie działać na warstwie transkrypcji, co pozwoli na uzyskanie maksymalnej liczby wyników.

 

Spis treści