Posty otagowane: narzędzia badawcze

Cz. II: Cyfrowe kompetencje badawcze

Transformacja infrastrukturalna literaturoznawstwa, obejmująca remediację zasobów, gatunków i praktyk ma także wymiar indywidualny czyli zestaw kompetencji niezbędnych każdej osobie, zamierzającej operować na gruncie cyfrowej humanistyki. Wychodzimy tu z założenia, że należy odróżnić humanistykę cyfrową – czyli [..]

Cz. I: Przemiana gatunków

Poprzedni fragment Prace zebrane w tej części mają jeden wspólny mianownik – ukazują remediację infrastrukturalną tradycyjnych gatunków literaturoznawczych, podkreślając ich narzędziowy charakter we współczesnej praktyce badawczej. Zasoby biograficzne, bibliograficzne czy leksykograficzne, [..]

Panorama

Nie bój się! i mnie ta niezgorzej przecie… Stefan Żeromski   Centrum Humanistyki Cyfrowej kończy dziesięć lat. To dobry moment, by się zatrzymać i rozejrzeć. Pierwsze podsumowanie działalności CHC powstało cztery lata po jego powstaniu, gdy – podobnie jak rodzicom czterolatka – zespołowi towarzyszył zarówno [..]

Wstęp

Zmieniające się potrzeby użytkowników, wzrost liczby wydawanych publikacji oraz pojawiające się nowe typy dokumentów i rodzaje nośników wpływały na rozwój bibliografii i przyczyniały się do rozwoju warsztatu dokumentalistycznego, kompetencji i wypracowania nowych metod [..]

Rozwój infrastruktury literaturoznawczej

Poprzedni fragment Dariah.lab jest dobrym przykładem infrastruktury tworzonej do wsparcia konkretnej dyscypliny i zadań badawczych. Oprócz stworzenia poszczególnych elementów infrastruktury kluczowa jest praca konceptualna nad całościowym kształtem docelowej literaturoznawczej infrastruktury [..]

Infrastruktura cyfrowa dla literaturoznawstwa w ramach projektu Dariah.lab

Poprzedni fragment Model cyfryzacji procesu badawczego został wykorzystany w pracach IBL PAN w ramach projektu Dariah.lab, którego zadaniem było stworzenie solidnych podstaw infrastrukturalnych literaturoznawczej infrastruktury badawczej. Celem prac było rozpoznanie cyfrowych potrzeb badawczych [..]

Czym jest infrastruktura badawcza

Poprzedni fragment W tej sekcji wykorzystujemy fragmenty opisu infrastruktur, przygotowane przez Macieja Maryla w formie haseł słownikowych do narzędziownika SHAPE-ID shapeidtoolkit.eu. Infrastruktury badawcze (IB) mają za zadanie wspierać naukowców na różnych etapach pracy [..]

Cyfryzacja procesu badawczego

Poprzedni fragment Na wszystkich etapach procesu badawczego, od znajdowania i pozyskiwania danych, poprzez ich przechowywanie, analizę, interpretację i publikację – korzystamy dziś z metod i narzędzi cyfrowych. Szczegółowe rozważania dotyczące przemian w tym zakresie zachodzących [..]

Wprowadzenie

W tym rozdziale omawiamy koncepcję cyfryzacji literaturoznawczego procesu badawczego z perspektywy istniejących międzynarodowych infrastruktur badawczych Każda z nich – DARIAH, CLARIN, OPERAS – prowadzi działania wspierające badania naukowe na wszystkich etapach procesu badawczego. [..]

Kto skorzysta z naszych badań? Badania użytkowników, angażowanie odbiorców oraz budowanie społeczności

W projektach badawczych i infrastrukturalnych bardzo dużą wagę przywiązuje się do osób, które będą korzystać z ich wyników. Czasami chodzi wyłącznie o grono akademickie, ale większość projektów wychodzi do szerszych grup społecznych, które bierzemy pod uwagę, dodatkowo [..]

Przykład analizy sieciowej z wykorzystaniem Gephi

Poprzedni fragment Dane sieciowe przygotowane w poprzednim punkcie, lub pozyskane z innych źródeł, można łatwo wizualizować i analizować w bezpłatnym programie Gephi. W tym podrozdziale dokonujemy krótkiej prezentacji zagadnienia, by pokazać łatwość obsługi i potencjał [..]

Analizy statystyczne

Poprzedni fragment Przykładem podejścia statystycznego są różne zestawienia metadanych tekstu. Kathearine Bode korzystała z australijskiej bibliografii literackiej, by pokazać jak w latach po II wojnie światowej rósł odsetek autorek wśród twórców powieści, co jednocześnie [..]

Narzędzia i serwisy do analizy tekstu

Jednym z serwisów umożliwiających opracowanie, a następnie analizę materiału tekstowego jest LEM (Literacki Eksplorator Maszynowy) (Maryl, Piasecki, i Walkowiak 2018). Jest to serwis opracowany z myślą o przetwarzaniu tekstów literackich w języku polskim, przede wszystkim [..]

Opracowanie tekstu

Pierwszym etapem opracowania tekstu jest jego segmentacja, czyli podział na jednostki – zależnie od tego, jaki jest cel segmentacji, mogą być to tokeny, zdania, chunki etc. Każdy tekst korpusu może zostać podzielony na tokeny, to znaczy najmniejsze wydzielane jednostki znaczące. [..]

Tworzenie korpusów

Pierwszym etapem analizy jest stworzenie korpusu językowego lub korpusu tekstowego. Jest to pojęcie z zakresu językoznawstwa korpusowego. Najprościej mówiąc, korpus tekstowy jest po prostu zbiorem tekstów spełniających określone kryteria (Lewandowska-Tomaszczyk 2005). Zależnie od potrzeb [..]

Czym jest NLP

Poprzedni fragment Przetwarzanie Języka Naturalnego (Natural Language Processing, NLP) to szerokie określenie, obejmujące wszelkie działania związane z cyfrowymi badaniami nad tekstem. Obejmuje zarówno tworzenie tekstów (wypowiedzeń), przetwarzanie tekstów i korpusów, w tym analizowaniem [..]
Il. 5 Analiza stylometryczna korpusu dramatów Juliusza Słowackiego – mapa ciepła, źródło: WebSty, oprac. własne

Narzędzia (WebSty, Stylo)

Do analizy stylometrycznej wykorzystać można serwis WebSty (Eder, Piasecki, i Walkowiak 2017; Piasecki, Walkowiak, i Eder 2018). Działa on w oparciu o kilka komponentów, dzięki którym tworzy listę cech poszczególnych tekstów wchodzących w skład badanego korpusu [..]
Il. 2 Analiza stylometryczna korpusu dramatów Juliusza Słowackiego, wykres kołowy, źródło: WebSty, oprac. własne

Czym jest stylometria

Poprzedni fragment U podstaw stylometrii, która swoją historię datuje na długo przed powstaniem pierwszych komputerów, leży założenie, że styl – w interesującym nas tutaj przypadku styl literacki, bądź szerzej, styl pisania – może być scharakteryzowany za pomocą policzalnych [..]

Literatura i statystyka

Wykorzystanie narzędzi komputerowych w badaniach nad językiem i literaturą, choć samo ma stosunkowo niedługą historię, nie stanowi radykalnego zerwania z tradycjami badawczymi tych dyscyplin. Metody statystyczne były od dawna z sukcesami wykorzystywane [..]

Praca zespołowa

Poprzedni fragment Duże projekty humanistyczne, szczególnie te, w których uczestniczą badacze i badaczki z różnych ośrodków, wymagają dobrej komunikacji i organizacji pracy. Dzięki narzędziom cyfrowym, takim jak komunikatory, wirtualne dyski do przechowywania i udostępniania [..]

Menedżery bibliografii

Poprzedni fragment Programy do gromadzenia i zarządzania opisami bibliograficznymi pozwalają na efektywne zarządzanie literaturą naukową. Menedżery bibliografii ułatwiają zbieranie, przechowywanie, organizowanie i udostępnianie opisów bibliograficznych w jednym miejscu. Pomagają [..]

Przeszukiwanie informacji

Poprzedni fragment Wzrost liczby publikacji naukowych [Kulczycki 2019a, 16; por. 2019b] oraz powiększający się zasób publikacji w otwartym dostępie wymaga od studentów(-ek) i naukowców(-czyń) obok przeprowadzenia „tradycyjnych” kwerend bibliograficznych, przeszukiwania katalogów kartkowych, [..]

Kompetencje cyfrowe w literaturoznawstwie cyfrowym versus praktyczne kompetencje cyfrowe

Dyskutując o kompetencjach cyfrowych naukowców(-czyń) z obszaru badań literaturoznawczych należałoby dokonać ważnego rozróżnienia na umiejętności związane z prowadzeniem badań z wykorzystaniem zaawansowanych metod cyfrowych (w duchu humanistyki cyfrowej) od wykorzystania narzędzi [..]

Plany rozwoju

Stale rozwijająca się baza tekstów polskich z XVI wieku będzie dostarczała kolejnych danych do wykorzystania w Korpusie polszczyzny XVI wieku, co z kolei wpłynie na jakość i kompletność materiałów badawczych. Ponadto w drugim etapie prac korpus zostanie wyposażony [..]

Zastosowane rozwiązania

Istniejący obecnie zalążek korpusu liczy 135 tys. segmentów. Zdeponowano je w bazie danych, a poszczególne rekordy zostały wygenerowane na bazie plików XML utworzonych w specjalnym edytorze pozwalającym na ręczną segmentację i lematyzację tekstu oraz tagowanie poszczególnych [..]

Plany rozwoju

Słownik elektroniczny docelowo zawierać będzie wszystkie hasła znajdujące się w kartotece pracowni, która skutkiem dodawania kolejnych ekscerptów nie stanowi zamkniętego zbioru. Dodatkowo planowane jest wprowadzenie kolejnych typów haseł, co ułatwi wyszukanie słów, których XVI-wieczna [..]

Sposoby wykorzystania

Objaśnianie Od dawna i zgodnie z zamierzeniami twórców Słownik wykorzystywany jest jako źródło pomocnicze w badaniach historycznojęzykowych i historycznoliterackich nad wiekiem XVI, czego wyrazem (żeby sięgnąć do najnowszych) edycje tekstów (np. Artomius 2021, Rej 2022) [..]

Zastosowane rozwiązania

Ostatecznie dla elektronicznej wersji Słownika polszczyzny XVI wieku został opracowany prostszy i bardziej elastyczny w stosunku do proponowanego przez Szafrana formalizm (DTD zawiera tylko 57 elementów), który został użyty do testowego otagowania materiału XXXV tomu Słownika, [..]

Historia digitalizacji

Na przełomie XX i XXI w. techniki komputerowe coraz szerzej wkraczały do badań humanistycznych, otwierając nowe możliwości przetwarzania danych. Początkowo komputery dokonały rewolucji w przygotowaniu publikacji do druku i przez wiele lat w humanistyce wykorzystywane były [..]

Plany rozwoju

Ograniczenie bazy wyłącznie do tekstów znajdujących się w wykazie źródeł podstawowych Słownika polszczyzny XVI wieku od samego początku nie było intencją jej powstania. W założeniu baza aspiruje do możliwie najpełniejszego repozytorium tekstów XVI-wiecznej polszczyzny przygotowanych [..]

Sposoby wykorzystania

Dzięki możliwie najwierniejszemu oddaniu typografii tekstu baza może służyć różnym wyrafinowanym zadaniom. Dla zasobu tego zaplanowano konkretne sposoby wykorzystania w ramach platformy spxvi.edu.pl, ponieważ jednak jest ona udostępniana jako zasób otwarty na licencji Creative Commons, przewidywane jest [..]

Zastosowane rozwiązania

Baza tekstów dostępna jest jako element serwisu internetowego Słownika polszczyzny XVI wieku. Poszczególne teksty były przygotowywane w specjalnie zaprojektowanym edytorze, zdolnym zapisywać pliki w formacie XML z zastosowaniem wybranego zestawu znaczników TEI opisującego strukturę typograficzną [..]

Realizacje cyfrowe zespołu Nowej Panoramy Literatury Polskiej przy CHC IBL PAN

Inną genezę miał rozpoczęty równocześnie z „Topo-grafiami” projekt Nowej Panoramy Literatury Polskiej (dalej NPLP) stworzony przy Centrum Humanistyki Cyfrowej IBL PAN. Prace NPLP nigdy nie były skupione na jednorodnym projekcie badawczym; od początku celem zespołu było tworzenie różnorodnych [..]
Il. 4 Szkice map powstałe podczas prac koncepcyjnych nad kolekcją Sienkiewicz Ponowoczesny Nowej Panoramy Literatury Polskiej, rys. Bartłomiej Szleszyński (z lewej) i Konrad Niciński (z prawej)

Problem granic topografii i kartografii: zagadnienie map niekartograficznych

Poprzedni fragment Pragmatyczne traktowanie mapy w środowisku cyfrowym jako narzędzia do opowiadania, uwarunkowanego charakterystyką konkretnej realizacji, niesie za sobą możliwość swobodnego (ale wciąż świadomego) doboru środków formalnych i technicznych do jej tworzenia. Warstwa [..]
Il. 13 Ekran widoku indeksu na stronie cyfrowego słownika; źródło: oprac. własne

Nowe możliwości remediacji

Poprzedni fragment   Szczegółowy opis budowy oraz funkcjonalności słownika Polscy pisarze i badacze literatury XX i XXI wieku to temat na osobny, obszerny artykuł. Stopień złożoności cyfrowej struktury przybliża załączony diagram, wypracowany na etapie analizy i modelowania [..]
Il. 7 Widok menu w backendzie dla Złotego słownika; źródło oprac. własne

Remediacja złotego słownika

Poprzedni fragment Wydobycie czystego tekstu – Import etap I   W procesie konwersji papierowego źródła na bazę danych podstawowym zadaniem jest digitalizacja, czyli proces zamiany informacji zapisanej analogowo na jej reprezentację cyfrową. W przypadku złotego słownika, wydawanego [..]
Il. 6 Tomy kolejnych serii słowników; źródło: oprac. własne

Proces remediacji w praktyce

Poprzedni fragment Narzędziem wykorzystanym do zbudowania aplikacji słownika Polscy pisarze i badacze literatury XX i XXI wieku była deweloperska platforma bazodanowa InstaDB, stworzona w 2009 roku przez firmę Atinea, która w następnych latach rozwijała i skomercjalizowała [..]
Il. 5 Strona główna cyfrowego słownika; źródło: oprac. własne

Niebieski słownik

Zasadniczym celem, wpisanym we wniosek grantowy złożony w konkursie Narodowego Programu Rozwoju Humanistyki w 2018 roku, było przygotowanie nowej edycji biograficzno-bibliograficznego kompendium – już wyłącznie w wersji cyfrowej. Miało ono dostarczać rzetelnej wiedzy o polskich pisarzach [..]

Kluczowe aspekty technologicznej transformacji bibliografii

Poprzedni fragment Jedną z cech charakterystycznych humanistycznej infrastruktury badawczej są procesy jej remediacji i transformacji cyfrowej, które polegają na przekształceniu wydawnictw drukowanych do form baz danych czy infrastruktur badawczych. W wymiarze technologicznym [..]
Il. 7 Mapa miejsc związanych z rekordem bibliograficznym, źródło: wizualizacja z serwisu literarybibliography.eu

Tworzenie własnych usług oraz rozwój badań i innowacji – literarybibliography.eu (2022-)

Zmiana sposobu pracy, wykorzystanie nowoczesnych technologii, rozwój wewnętrznych kompetencji pozwalają na innowacje, tworzenie własnych rozwiązań. Pierwszym w pełni samodzielnym tworem – koncepcyjnym i technologicznym – zespołu PBL był European Literary Bibliography (ELB), agregator literackich [..]

Transformacja cyfrowa – etap II – przekształcenie w cyfrową infrastrukturę (2018-2023)

Automatyzacja pozyskiwania i przetwarzania danych bibliograficznych jako proces wewnętrzny (2018-2019) Współczesne usługi bibliograficzne opierają się na systemach wymiany danych takich jak współkatalogowanie (Dwornik 2018) czy agregacja metadanych (Freire et al. 2018). Rozwiązania [..]
Il. 3 Fragment strony głównej nowego portalu PBL-u, źródło: zrzut ekranu ze strony pbl.ibl.waw.pl

Transformacja cyfrowa – nowy serwis (pbl.ibl.waw.pl) przykładem odejścia od ograniczeń „drukowanego interfejsu” (2015-2018)

Poprzez transformację cyfrową rozumiemy intencjonalny i strategiczny proces mający objąć całość danej organizacji czy przedsięwzięcia, opartą na wykorzystaniu technologii cyfrowych w celu poszukiwania przewag konkurencyjnych. Różnica między transformacją i remediacją polega zatem [..]

Remediacja wydawnictwa drukowanego (1998-2001)

Poprzedni fragment „Polska Bibliografia Literacka” w swoim zamierzeniu stanowi bibliografię bieżącą o bardzo szerokim zakresie. Swym zasięgiem obejmuje polskie teksty literackie i paraliterackie (opublikowane zarówno w postaci druków zwartych, jak i na łamach czasopism krajowych [..]
Il. 9 Platforma naukowych edycji cyfrowych TEI Panorama, widok bytów w dramacie Śmierci białej pończochy Mariana Pankowskiego, źródło: tei.nplp.pl/documents/1622/versions/1666/fragments/2059

Manufaktura naukowych edycji cyfrowych. TEI Panorama

Elena Pierazzo wyróżnia dwa podejścia tworzenia naukowych edycji cyfrowych (2019: 213). Pierwsze z nich, odnoszące się do metafory projektowania odzieży Haute Couture (fr. wysokie krawiectwo), to wytwarzanie edycji cyfrowych innowacyjnych, mających wszystkie funkcjonalności skupione najczęściej [..]

Wiele narzędzi, jeden standard?

Istnieje jeszcze jeden “kierunkowskaz” dla tworzenia naukowych edycji cyfrowych. Niezmiennie dominujący w przestrzeni cyfrowej w humanistycznych projektach mimo licznych transformacji narzędzi i warstwy wizualnej czy poszerzaniu pola danych. Mowa o standardzie kodowania TEI, Text Encoding [..]

Żywioł cyfrowości w edytorstwie naukowym (tekstów literackich)

Naukowe edytorstwo cyfrowe jest ważne w humanistyce. Wystarczy spojrzeć na program z 2023 największej konferencji humanistyczno-cyfrowej – Digital Humanities organizowanej przez The Alliance of Digital Humanities Organizations (ADHO). To właśnie edytorstwu cyfrowemu poświęcono [..]

Warning: Undefined array key "orderby" in /home/klient.dhosting.pl/aszulinska/nplp.pl/public_html/wp-content/themes/nplp/partials/toc-12828.php on line 12

Warning: Undefined array key "order" in /home/klient.dhosting.pl/aszulinska/nplp.pl/public_html/wp-content/themes/nplp/partials/toc-12828.php on line 13
Spis treści