Plany rozwoju
Krzysztof Opaliński, Patrycja Potoniec

Plany rozwoju
Krzysztof Opaliński, Patrycja Potoniec

Stale rozwijająca się baza tekstów polskich z XVI wieku będzie dostarczała kolejnych danych do wykorzystania w Korpusie polszczyzny XVI wieku, co z kolei wpłynie na jakość i kompletność materiałów badawczych. Ponadto w drugim etapie prac korpus zostanie wyposażony w znacznie dokładniejsze i bardziej użyteczne narzędzie do wyszukiwania. Stanie się to możliwe również dzięki dodaniu do transliterowanych tekstów warstwy transkrypcji, która umożliwi łatwiejsze przetwarzanie tekstu, oraz bogatego wachlarza metadanych pozwalających na szczegółową klasyfikację i kategoryzację tekstów.

Prace nad zalążkiem korpusu umożliwiły wyciągnięcie wniosków dotyczących metodologii i zweryfikowały wizję korpusu w przyszłości. Priorytetem w kreśleniu przyszłości korpusu jest stworzenie możliwości integracji z innymi korpusami diachronicznymi języka polskiego. Zaistnienie Korpusu Barokowego stało się dowodem na możliwość zastosowania tagsetu kompatybilnego z istniejącym i uznanym Narodowym Korpusem Języka Polskiego. Możliwe jest też wdrożenie sprawdzonych na większych korpusach narzędzi informatycznych (tagery, analizatory morfosyntaktyczne i wyszukiwarki). W przyszłości połączenie rozproszonych projektów korpusowych w jeden spójny system stworzy potężne narzędzie badawcze dla badaczy dawnych literatur, języka czy historii.

 

Bibliografia

Spis treści