Il. 5 Analiza stylometryczna korpusu dramatów Juliusza Słowackiego – mapa ciepła, źródło: WebSty, oprac. własne

Narzędzia (WebSty, Stylo)
Anna Mędrzecka-Stefańska

Narzędzia (WebSty, Stylo)
Anna Mędrzecka-Stefańska

Do analizy stylometrycznej wykorzystać można serwis WebSty (Eder, Piasecki, i Walkowiak 2017; Piasecki, Walkowiak, i Eder 2018). Działa on w oparciu o kilka komponentów, dzięki którym tworzy listę cech poszczególnych tekstów wchodzących w skład badanego korpusu (są to np. frekwencja najczęściej występujących w tekście słów i klas gramatycznych, interpunkcja, sekwencje klas gramatycznych etc.). Następnie porównuje teksty pod kątem wybranych cech i tworzy sieć powiązań.

WebSty pozwala na przeprowadzenie badań stylometrycznych uwzględniających kryteria wyznaczone przez badacza (np. wybór cech, pod kątem których porównywane będą teksty, czy wybór sposobu przeliczania wyników). Następnie wyświetla wyniki w formie kilku rodzajów wykresów, powstających z wykorzystaniem zasady macierzy, tj. usytuowania bliżej siebie tych punktów, które odpowiadają tekstom najbliższym sobie pod względem największej liczby cech. WebSty nie działa na podstawie predefiniowanego zestawu cech, pod kątem których porównuje utwory, a w procesie porównania wydobywa cechy i ocenia ich istotność. Interpretacja uzyskanych w ten sposób wyników wymaga od badacza sporych kompetencji, ponieważ wykresy pokazują obraz uproszczony, a lektura listy cech obliczonych przez narzędzie może nastręczać trudności.

Do analizy stylometrycznej i atrybucji autorskiej można wykorzystać także otwarte oprogramowanie „Stylometry with R”, zwane też po prostu Stylo. Jest to otwarty program napisany w języku R, umożliwiający przeprowadzanie analiz stylometrycznych. Autorami tego programu są Maciej Eder, Mike Kestemont, Jan Rybicki oraz Steffen Pielström.

Do analizy autorstwa można wykorzystać też narzędzie, którego głównym zadaniem jest modelowanie tematyczne – Topic (Walkowiak 2017). Modelowanie tematyczne polega na ekstrakcji z tekstów określonej liczby głównych tematów w postaci spójnych semantycznie grup słów. Na tej podstawie teksty mogą zostać pogrupowane według podobieństwa, mogą zostać przyporządkowane do określonego gatunku lub zbioru.

Il. 6 Analiza stylometryczna korpusu dramatów Juliusza Słowackiego – skalowanie wielowymiarowe, źródło: WebSty, oprac. własne

Il. 6 Analiza stylometryczna korpusu dramatów Juliusza Słowackiego – skalowanie wielowymiarowe, źródło: WebSty, oprac. własne

 

Następny fragment

Spis treści