NPLP

\

Panorama literaturoznawstwa cyfrowego

\

Portal spxvi.edu.pl – infrastruktura do badania literatur dawnych

\

Korpus językowy

\

Zastosowane rozwiązania

Zastosowane rozwiązania
Krzysztof Opaliński, Patrycja Potoniec

Zastosowane rozwiązania
Krzysztof Opaliński, Patrycja Potoniec

← Poprzedni fragment

Istniejący obecnie zalążek korpusu liczy 135 tys. segmentów. Zdeponowano je w bazie danych, a poszczególne rekordy zostały wygenerowane na bazie plików XML utworzonych w specjalnym edytorze pozwalającym na ręczną segmentację i lematyzację tekstu oraz tagowanie poszczególnych segmentów znacznikami fleksyjnymi. W procesie segmentacji i tagowania wykorzystano stworzony specjalnie na potrzeby digitalizacji słownika i bazy tekstów edytor XML, w którym dodatkowy moduł oprócz możliwości ręcznego podziału tekstu na segmenty pozwala na przypisanie poszczególnym segmentom trzech podstawowych wartości: identyfikatora wyrazu hasłowego (lematu) w indeksie słownika, odczytanej postaci segmentu w tekście oraz jego formy gramatycznej. Zalążek korpusu zaopatrzony jest w prostą wyszukiwarkę, która pozwala na odnalezienie szukanego segmentu lub jego fragmentu (np. określonego prefiksu bądź sufiksu). Wyniki wyszukiwania wyświetlane są w zależności od ustawień użytkownika jako tekst transliterowany lub transkrybowany, przy czym każdy wyszukany segment zaopatrzony jest w kontekst ustalony na 5 segmentów przed i po. Przy wynikach wyświetlane są również pozostałe dane: kategorie gramatyczne, znaczniki fleksyjne, lokalizacja w tekście oraz forma podstawowa, przy czym na bazie lokalizacji i formy tworzone są linki odsyłające odpowiednio do określonego miejsca w całym tekście lub do hasła w słowniku elektronicznym.

Il. 10. Przykład wyniku wyszukiwania w korpusie, źródło: spxvi.edu.pl

Il. 10. Przykład wyniku wyszukiwania w korpusie, źródło: spxvi.edu.pl

Następny fragment →

Tagi:

Spis treści

Wstęp
- Panorama
  - Panorama
- Centrum Humanistyki Cyfrowej
  - Centrum Humanistyki Cyfrowej
- O monografii
- Bibliografia i DOI
  - Bibliografia i DOI
Naukowe edytorstwo cyfrowe
- Naukowe edytorstwo cyfrowe na mapie humanistyki cyfrowej
- Przegląd wybranych studiów przypadków
- Bibliografia i DOI
  - Bibliografia i DOI
Monografie cyfrowe
- Monografia cyfrowa - nowe możliwości i wyzwania
- Nowa Panorama Literatury Polskiej - geneza i miejsce na mapie cyfrowego literaturoznawstwa
- Jak się tworzy naukową kolekcję cyfrową
  - Jak się tworzy naukową kolekcję cyfrową
- Monografie cyfrowe a współczesne badania literackie
  - Monografie cyfrowe a współczesne badania literackie
- Bibliografia i DOI
  - Bibliografia i DOI
Bibliografie cyfrowe
- Wstęp
  - Wstęp
- Przemiany form bibliografii
- Przemiany kompetencji bibliograficznych
  - Przemiany kompetencji bibliograficznych
- Kluczowe aspekty technologicznej transformacji bibliografii
  - Kluczowe aspekty technologicznej transformacji bibliografii
- Bibliografia i DOI
  - Bibliografia i DOI
Remediacja kompendium biobibliograficznego
- Remediacja kompedium bibliograficznego jako wyzwanie
  - Remediacja kompedium bibliograficznego jako wyzwanie
- Od druku do cyfrowości
- Etapy remediacji
  - Proces remediacji w praktyce
- Remediacja złotego słownika
  - Remediacja złotego słownika
- Nowe możliwości
  - Nowe możliwości remediacji
- Bibliografia i DOI
  - Bibliografia i DOI
Literackie topografie cyfrowe
- Najważniejsze strategie topograficzne humanistyki cyfrowej
- Problem granic topografii i kartografii: zagadnienie map niekartograficznych
  - Problem granic topografii i kartografii: zagadnienie map niekartograficznych
- Polskie realizacje cyfrowe: nauki historyczne
  - Polskie realizacje cyfrowe: nauki historyczne
- Topografie w cyfrowym literaturoznawstwie
- Mapowanie cyfrowe z perspektywy projektantki
  - Mapowanie cyfrowe z perspektywy projektantki
- Bibliografia i DOI
  - Bibliografia i DOI
Portal spxvi.edu.pl – infrastruktura do badania literatur dawnych
- Wstęp
  - Wstęp
- Baza tekstów
- Słownik
- Korpus językowy
- Bibliografia i DOI
  - Bibliografia i DOI
Praktyczne kompetencje cyfrowe
- Wszyscy jesteśmy cyfrowymi humanist(k)ami
  - Zwrot cyfrowy i technologia w pracy naukowej
  - Kompetencje cyfrowe w literaturoznawstwie cyfrowym versus praktyczne kompetencje cyfrowe
- Przeszukiwanie informacji
  - Przeszukiwanie informacji
- Edytory/procesory tekstu
  - Edytory/procesory tekstu
- Menedżery bibliografii
  - Menedżery bibliografii
- Upowszechnianie wyników badań
  - Upowszechnianie wyników badań
- Praca zespołowa
  - Praca zespołowa
- Bibliografia i DOI
  - Bibliografia i DOI
Ilościowa analiza tekstów, NLP
- Literatura i statystyka
  - Literatura i statystyka
- Stylometria
  - Czym jest stylometria
  - Narzędzia (WebSty, Stylo)
- Przetwarzanie Języka Naturalnego (Natural Language Processing, NLP)
- Bibliografia i DOI
  - Bibliografia i DOI
Analiza danych o kulturze
- Dane o kulturze
  - Dane o kulturze
- Analiza i wizualizacja danych
- Przygotowanie danych
  - Przygotowanie danych
- Przykład analizy sieciowej z wykorzystaniem Gephi
  - Przykład analizy sieciowej z wykorzystaniem Gephi
- Zarządzanie danymi
  - Zarządzanie danymi
- Bibliografia i DOI
  - Bibliografia i DOI
Społeczność / użytkownicy / stakeholderzy
- Kto skorzysta z naszych badań? Badania użytkowników, angażowanie odbiorców oraz budowanie społeczności
  - Kto skorzysta z naszych badań? Badania użytkowników, angażowanie odbiorców oraz budowanie społeczności
- Metodologia badań użytkowników
  - Metodologia badań użytkowników
- Inspire: jak badać “społeczność bez społeczności” - polskich humanistów cyfrowych?
- Testowanie w humanistyce cyfrowej jako sposób angażowania potencjalnych użytkowników
- Inne przykłady budowania społeczności
- Bibliografia i DOI
  - Bibliografia i DOI
Infrastruktura
- Wprowadzenie
  - Wprowadzenie
- Cyfryzacja procesu badawczego (M. Maryl)
  - Cyfryzacja procesu badawczego
- Czym jest infrastruktura badawcza
  - Czym jest infrastruktura badawcza
- Infrastruktury badawcze
  - DARIAH
  - CLARIN
  - OPERAS
- Infrastruktura cyfrowa dla literaturoznawstwa w ramach projektu Dariah.lab (T. Umerle, M. Maryl)
  - Infrastruktura cyfrowa dla literaturoznawstwa w ramach projektu Dariah.lab
- Rozwój infrastruktury literaturoznawczej (T.Umerle, M.Maryl)
  - Rozwój infrastruktury literaturoznawczej
- Bibliografia i DOI
  - Bibliografia i DOI
Rzecznictwo w humanistyce
- Czym jest rzecznictwo
  - Czym jest rzecznictwo
- Jak skutecznie prowadzić komunikację w sieci?
- „Królowe Humanistyki”: media społecznościowe jako narzędzie działań rzeczniczych
  - „Królowe Humanistyki”: media społecznościowe jako narzędzie działań rzeczniczych
- OPERAS-PL jako przykład rzecznictwa dla otwartej komunikacji naukowej w humanistyce
  - OPERAS-PL jako przykład rzecznictwa dla otwartej komunikacji naukowej w humanistyce
- Przykłady innowacyjnych publikacji naukowych w humanistyce
  - Przykłady innowacyjnych publikacji naukowych w humanistyce
- Bibliografia i DOI
  - Bibliografia i DOI
Posłowie
- Spotkania z literaturoznawstwem cyfrowym
  - Spotkania z literaturoznawstwem cyfrowym
- Spotkania
- Bibliografia i DOI
  - Bibliografia i DOI