Czym jest stylometria
U podstaw stylometrii, która swoją historię datuje na długo przed powstaniem pierwszych komputerów, leży założenie, że styl – w interesującym nas tutaj przypadku styl literacki, bądź szerzej, styl pisania – może być scharakteryzowany za pomocą policzalnych elementów tekstu (Eder 2016; Love 2002). Elementy te, często drobne i nieznaczące, z punktu widzenia czytelnika pomijalne – jak np. częstotliwość użycia określonych spójników czy znaków interpunkcyjnych – stanowić mają stylistyczny odcisk palca autora, którego nie jest on w stanie zmienić, nawet jeśli próbuje (Eder 2023). Opierając się na tym założeniu, badacze analizowali występowanie różnych słów i form gramatycznych, a także np. znaków interpunkcyjnych, aby ustalić prawdopodobieństwo autorstwa danego tekstu bądź jego chronologii. Tak w XIX wieku Wincenty Lutosławski w pierwszej pracy, w której użyto określenia „stylometria”, próbował ustalić chronologię powstania dialogów Platona (Lutosławski 1897). Podobnie Witold Kuraszkiewicz, powołując się na specyficzne elementy stylu Mikołaja Reja, starał się ustalić prawdopodobieństwo, iż był on autorem Wizerunku (Kuraszkiewicz 1969).
Jednak prawdziwy rozwój badań stylometrycznych wprowadziło użycie komputerów, które pozwalają nie tylko na poddanie badaniom bardzo dużych zbiorów tekstów jednocześnie, ale też są w stanie przeprowadzić skomplikowane wyliczenia, oparte nie tylko na najprostszych statystykach, od jakich zaczęła się historia stylometrii.
To właśnie narzędzia cyfrowe (w szczególności skalowanie wielowymiarowe) w połączeniu z podejściem stylometrycznym wykorzystał Maciej Eder w projekcie, którego celem miało być ustalenie autorstwa Kroniki Galla Anonima. Badacz wykazał, że wykorzystanie trzech różnych wariantów metody najbliższego sąsiada konsekwentnie pojawia się ten sam wynik. Największe podobieństwo, i to podobieństwo znaczące, pojawia się między Kroniką Galla Anonima a pismami Mnicha z Lito, co potwierdzałoby hipotezę o pochodzeniu autora z weneckiego kręgu kulturowego. Niestety, ze względu na niedostateczną obszerność zachowanego materiału z epoki, wyniki powinny być brane z pewnym dystansem; nie przesądzają one jednoznacznie o autorstwie konkretnej osoby, wskazują jednak na związek analizowanych utworów, co z dużym prawdopodobieństwem świadczy co najmniej o podobnym zapleczu ich twórców.
Mówiąc o stylometrii warto wspomnieć też o pracach Jana Rybickiego, autora aż trzech Rzutów oka na stylometryczną mapę Polski (Rybicki 2014; 2017; 2021), a także hipotezy, iż popularna włoska pisarka Elena Ferrante, której tożsamość pozostaje oficjalnie nieznana, to Domenico Starnone. Analizy prowadzone przez tego badacza opierają się przede wszystkim na porównaniu występowania określonej liczby najczęściej występujących lematów i na tej podstawie wyznaczeniu odległości i pokrewieństwa między analizowanymi tekstami.
Badania stylometryczne mogą mieć wiele zastosowań. Pierwotnym z nich jest ustalanie autorstwa tekstu i chronologii powstawania poszczególnych utworów, ale wykorzystane mogą być też np. do grupowania tekstów wedle stylu w obrębie danego zbioru. Potwierdzenie lub wykluczenie autorstwa bywa wykorzystywane nie tylko w badaniach literatury, ale też m.in. wspiera działanie programów antyplagiatowych.
Tak więc metody statystyczne wydają się płodną odpowiedzią na wiele pytań, które stają przed badaczami, starającymi się zrozumieć specyfikę poszczególnych tekstów i porównywać je pod względem cech, które uznają za relewantne. Przy tym konieczna jest świadomość ograniczeń metody, która będzie jedynie tak dobra, jak pytania postawione przez badacza i jak jego umiejętność wyciągnięcia z uzyskanego materiału informacji.