Posty otagowane: narzędzia badawcze
Cz. II: Cyfrowe kompetencje badawcze
Transformacja infrastrukturalna literaturoznawstwa, obejmująca remediację zasobów, gatunków i praktyk ma także wymiar indywidualny czyli zestaw kompetencji niezbędnych każdej osobie, zamierzającej operować na gruncie cyfrowej humanistyki. Wychodzimy tu z założenia, że należy odróżnić humanistykę cyfrową – czyli [..]Cz. I: Przemiana gatunków
Poprzedni fragment Prace zebrane w tej części mają jeden wspólny mianownik – ukazują remediację infrastrukturalną tradycyjnych gatunków literaturoznawczych, podkreślając ich narzędziowy charakter we współczesnej praktyce badawczej. Zasoby biograficzne, bibliograficzne czy leksykograficzne, [..]Panorama
Nie bój się! i mnie ta niezgorzej przecie… Stefan Żeromski Centrum Humanistyki Cyfrowej kończy dziesięć lat. To dobry moment, by się zatrzymać i rozejrzeć. Pierwsze podsumowanie działalności CHC powstało cztery lata po jego powstaniu, gdy – podobnie jak rodzicom czterolatka – zespołowi towarzyszył zarówno [..]Wstęp
Zmieniające się potrzeby użytkowników, wzrost liczby wydawanych publikacji oraz pojawiające się nowe typy dokumentów i rodzaje nośników wpływały na rozwój bibliografii i przyczyniały się do rozwoju warsztatu dokumentalistycznego, kompetencji i wypracowania nowych metod [..]Rozwój infrastruktury literaturoznawczej
Poprzedni fragment Dariah.lab jest dobrym przykładem infrastruktury tworzonej do wsparcia konkretnej dyscypliny i zadań badawczych. Oprócz stworzenia poszczególnych elementów infrastruktury kluczowa jest praca konceptualna nad całościowym kształtem docelowej literaturoznawczej infrastruktury [..]Infrastruktura cyfrowa dla literaturoznawstwa w ramach projektu Dariah.lab
Poprzedni fragment Model cyfryzacji procesu badawczego został wykorzystany w pracach IBL PAN w ramach projektu Dariah.lab, którego zadaniem było stworzenie solidnych podstaw infrastrukturalnych literaturoznawczej infrastruktury badawczej. Celem prac było rozpoznanie cyfrowych potrzeb badawczych [..]Czym jest infrastruktura badawcza
Poprzedni fragment W tej sekcji wykorzystujemy fragmenty opisu infrastruktur, przygotowane przez Macieja Maryla w formie haseł słownikowych do narzędziownika SHAPE-ID shapeidtoolkit.eu. Infrastruktury badawcze (IB) mają za zadanie wspierać naukowców na różnych etapach pracy [..]Cyfryzacja procesu badawczego
Poprzedni fragment Na wszystkich etapach procesu badawczego, od znajdowania i pozyskiwania danych, poprzez ich przechowywanie, analizę, interpretację i publikację – korzystamy dziś z metod i narzędzi cyfrowych. Szczegółowe rozważania dotyczące przemian w tym zakresie zachodzących [..]Wprowadzenie
W tym rozdziale omawiamy koncepcję cyfryzacji literaturoznawczego procesu badawczego z perspektywy istniejących międzynarodowych infrastruktur badawczych Każda z nich – DARIAH, CLARIN, OPERAS – prowadzi działania wspierające badania naukowe na wszystkich etapach procesu badawczego. [..]Kto skorzysta z naszych badań? Badania użytkowników, angażowanie odbiorców oraz budowanie społeczności
W projektach badawczych i infrastrukturalnych bardzo dużą wagę przywiązuje się do osób, które będą korzystać z ich wyników. Czasami chodzi wyłącznie o grono akademickie, ale większość projektów wychodzi do szerszych grup społecznych, które bierzemy pod uwagę, dodatkowo [..]Przykład analizy sieciowej z wykorzystaniem Gephi
Poprzedni fragment Dane sieciowe przygotowane w poprzednim punkcie, lub pozyskane z innych źródeł, można łatwo wizualizować i analizować w bezpłatnym programie Gephi. W tym podrozdziale dokonujemy krótkiej prezentacji zagadnienia, by pokazać łatwość obsługi i potencjał [..]Analizy statystyczne
Poprzedni fragment Przykładem podejścia statystycznego są różne zestawienia metadanych tekstu. Kathearine Bode korzystała z australijskiej bibliografii literackiej, by pokazać jak w latach po II wojnie światowej rósł odsetek autorek wśród twórców powieści, co jednocześnie [..]Narzędzia i serwisy do analizy tekstu
Jednym z serwisów umożliwiających opracowanie, a następnie analizę materiału tekstowego jest LEM (Literacki Eksplorator Maszynowy) (Maryl, Piasecki, i Walkowiak 2018). Jest to serwis opracowany z myślą o przetwarzaniu tekstów literackich w języku polskim, przede wszystkim [..]Opracowanie tekstu
Pierwszym etapem opracowania tekstu jest jego segmentacja, czyli podział na jednostki – zależnie od tego, jaki jest cel segmentacji, mogą być to tokeny, zdania, chunki etc. Każdy tekst korpusu może zostać podzielony na tokeny, to znaczy najmniejsze wydzielane jednostki znaczące. [..]Tworzenie korpusów
Pierwszym etapem analizy jest stworzenie korpusu językowego lub korpusu tekstowego. Jest to pojęcie z zakresu językoznawstwa korpusowego. Najprościej mówiąc, korpus tekstowy jest po prostu zbiorem tekstów spełniających określone kryteria (Lewandowska-Tomaszczyk 2005). Zależnie od potrzeb [..]Czym jest NLP
Poprzedni fragment Przetwarzanie Języka Naturalnego (Natural Language Processing, NLP) to szerokie określenie, obejmujące wszelkie działania związane z cyfrowymi badaniami nad tekstem. Obejmuje zarówno tworzenie tekstów (wypowiedzeń), przetwarzanie tekstów i korpusów, w tym analizowaniem [..]
Narzędzia (WebSty, Stylo)
Do analizy stylometrycznej wykorzystać można serwis WebSty (Eder, Piasecki, i Walkowiak 2017; Piasecki, Walkowiak, i Eder 2018). Działa on w oparciu o kilka komponentów, dzięki którym tworzy listę cech poszczególnych tekstów wchodzących w skład badanego korpusu [..]
Czym jest stylometria
Poprzedni fragment U podstaw stylometrii, która swoją historię datuje na długo przed powstaniem pierwszych komputerów, leży założenie, że styl – w interesującym nas tutaj przypadku styl literacki, bądź szerzej, styl pisania – może być scharakteryzowany za pomocą policzalnych [..]Literatura i statystyka
Wykorzystanie narzędzi komputerowych w badaniach nad językiem i literaturą, choć samo ma stosunkowo niedługą historię, nie stanowi radykalnego zerwania z tradycjami badawczymi tych dyscyplin. Metody statystyczne były od dawna z sukcesami wykorzystywane [..]Praca zespołowa
Poprzedni fragment Duże projekty humanistyczne, szczególnie te, w których uczestniczą badacze i badaczki z różnych ośrodków, wymagają dobrej komunikacji i organizacji pracy. Dzięki narzędziom cyfrowym, takim jak komunikatory, wirtualne dyski do przechowywania i udostępniania [..]Menedżery bibliografii
Poprzedni fragment Programy do gromadzenia i zarządzania opisami bibliograficznymi pozwalają na efektywne zarządzanie literaturą naukową. Menedżery bibliografii ułatwiają zbieranie, przechowywanie, organizowanie i udostępnianie opisów bibliograficznych w jednym miejscu. Pomagają [..]Przeszukiwanie informacji
Poprzedni fragment Wzrost liczby publikacji naukowych [Kulczycki 2019a, 16; por. 2019b] oraz powiększający się zasób publikacji w otwartym dostępie wymaga od studentów(-ek) i naukowców(-czyń) obok przeprowadzenia „tradycyjnych” kwerend bibliograficznych, przeszukiwania katalogów kartkowych, [..]Kompetencje cyfrowe w literaturoznawstwie cyfrowym versus praktyczne kompetencje cyfrowe
Dyskutując o kompetencjach cyfrowych naukowców(-czyń) z obszaru badań literaturoznawczych należałoby dokonać ważnego rozróżnienia na umiejętności związane z prowadzeniem badań z wykorzystaniem zaawansowanych metod cyfrowych (w duchu humanistyki cyfrowej) od wykorzystania narzędzi [..]Plany rozwoju
Stale rozwijająca się baza tekstów polskich z XVI wieku będzie dostarczała kolejnych danych do wykorzystania w Korpusie polszczyzny XVI wieku, co z kolei wpłynie na jakość i kompletność materiałów badawczych. Ponadto w drugim etapie prac korpus zostanie wyposażony [..]Zastosowane rozwiązania
Istniejący obecnie zalążek korpusu liczy 135 tys. segmentów. Zdeponowano je w bazie danych, a poszczególne rekordy zostały wygenerowane na bazie plików XML utworzonych w specjalnym edytorze pozwalającym na ręczną segmentację i lematyzację tekstu oraz tagowanie poszczególnych [..]Plany rozwoju
Słownik elektroniczny docelowo zawierać będzie wszystkie hasła znajdujące się w kartotece pracowni, która skutkiem dodawania kolejnych ekscerptów nie stanowi zamkniętego zbioru. Dodatkowo planowane jest wprowadzenie kolejnych typów haseł, co ułatwi wyszukanie słów, których XVI-wieczna [..]Sposoby wykorzystania
Objaśnianie Od dawna i zgodnie z zamierzeniami twórców Słownik wykorzystywany jest jako źródło pomocnicze w badaniach historycznojęzykowych i historycznoliterackich nad wiekiem XVI, czego wyrazem (żeby sięgnąć do najnowszych) edycje tekstów (np. Artomius 2021, Rej 2022) [..]Zastosowane rozwiązania
Ostatecznie dla elektronicznej wersji Słownika polszczyzny XVI wieku został opracowany prostszy i bardziej elastyczny w stosunku do proponowanego przez Szafrana formalizm (DTD zawiera tylko 57 elementów), który został użyty do testowego otagowania materiału XXXV tomu Słownika, [..]Historia digitalizacji
Na przełomie XX i XXI w. techniki komputerowe coraz szerzej wkraczały do badań humanistycznych, otwierając nowe możliwości przetwarzania danych. Początkowo komputery dokonały rewolucji w przygotowaniu publikacji do druku i przez wiele lat w humanistyce wykorzystywane były [..]Plany rozwoju
Ograniczenie bazy wyłącznie do tekstów znajdujących się w wykazie źródeł podstawowych Słownika polszczyzny XVI wieku od samego początku nie było intencją jej powstania. W założeniu baza aspiruje do możliwie najpełniejszego repozytorium tekstów XVI-wiecznej polszczyzny przygotowanych [..]Sposoby wykorzystania
Dzięki możliwie najwierniejszemu oddaniu typografii tekstu baza może służyć różnym wyrafinowanym zadaniom. Dla zasobu tego zaplanowano konkretne sposoby wykorzystania w ramach platformy spxvi.edu.pl, ponieważ jednak jest ona udostępniana jako zasób otwarty na licencji Creative Commons, przewidywane jest [..]Zastosowane rozwiązania
Baza tekstów dostępna jest jako element serwisu internetowego Słownika polszczyzny XVI wieku. Poszczególne teksty były przygotowywane w specjalnie zaprojektowanym edytorze, zdolnym zapisywać pliki w formacie XML z zastosowaniem wybranego zestawu znaczników TEI opisującego strukturę typograficzną [..]Realizacje cyfrowe zespołu Nowej Panoramy Literatury Polskiej przy CHC IBL PAN
Inną genezę miał rozpoczęty równocześnie z „Topo-grafiami” projekt Nowej Panoramy Literatury Polskiej (dalej NPLP) stworzony przy Centrum Humanistyki Cyfrowej IBL PAN. Prace NPLP nigdy nie były skupione na jednorodnym projekcie badawczym; od początku celem zespołu było tworzenie różnorodnych [..]
Problem granic topografii i kartografii: zagadnienie map niekartograficznych
Poprzedni fragment Pragmatyczne traktowanie mapy w środowisku cyfrowym jako narzędzia do opowiadania, uwarunkowanego charakterystyką konkretnej realizacji, niesie za sobą możliwość swobodnego (ale wciąż świadomego) doboru środków formalnych i technicznych do jej tworzenia. Warstwa [..]
Nowe możliwości remediacji
Poprzedni fragment Szczegółowy opis budowy oraz funkcjonalności słownika Polscy pisarze i badacze literatury XX i XXI wieku to temat na osobny, obszerny artykuł. Stopień złożoności cyfrowej struktury przybliża załączony diagram, wypracowany na etapie analizy i modelowania [..]
Remediacja złotego słownika
Poprzedni fragment Wydobycie czystego tekstu – Import etap I W procesie konwersji papierowego źródła na bazę danych podstawowym zadaniem jest digitalizacja, czyli proces zamiany informacji zapisanej analogowo na jej reprezentację cyfrową. W przypadku złotego słownika, wydawanego [..]
Proces remediacji w praktyce
Poprzedni fragment Narzędziem wykorzystanym do zbudowania aplikacji słownika Polscy pisarze i badacze literatury XX i XXI wieku była deweloperska platforma bazodanowa InstaDB, stworzona w 2009 roku przez firmę Atinea, która w następnych latach rozwijała i skomercjalizowała [..]
Niebieski słownik
Zasadniczym celem, wpisanym we wniosek grantowy złożony w konkursie Narodowego Programu Rozwoju Humanistyki w 2018 roku, było przygotowanie nowej edycji biograficzno-bibliograficznego kompendium – już wyłącznie w wersji cyfrowej. Miało ono dostarczać rzetelnej wiedzy o polskich pisarzach [..]Kluczowe aspekty technologicznej transformacji bibliografii
Poprzedni fragment Jedną z cech charakterystycznych humanistycznej infrastruktury badawczej są procesy jej remediacji i transformacji cyfrowej, które polegają na przekształceniu wydawnictw drukowanych do form baz danych czy infrastruktur badawczych. W wymiarze technologicznym [..]
Tworzenie własnych usług oraz rozwój badań i innowacji – literarybibliography.eu (2022-)
Zmiana sposobu pracy, wykorzystanie nowoczesnych technologii, rozwój wewnętrznych kompetencji pozwalają na innowacje, tworzenie własnych rozwiązań. Pierwszym w pełni samodzielnym tworem – koncepcyjnym i technologicznym – zespołu PBL był European Literary Bibliography (ELB), agregator literackich [..]Transformacja cyfrowa – etap II – przekształcenie w cyfrową infrastrukturę (2018-2023)
Automatyzacja pozyskiwania i przetwarzania danych bibliograficznych jako proces wewnętrzny (2018-2019) Współczesne usługi bibliograficzne opierają się na systemach wymiany danych takich jak współkatalogowanie (Dwornik 2018) czy agregacja metadanych (Freire et al. 2018). Rozwiązania [..]
Transformacja cyfrowa – nowy serwis (pbl.ibl.waw.pl) przykładem odejścia od ograniczeń „drukowanego interfejsu” (2015-2018)
Poprzez transformację cyfrową rozumiemy intencjonalny i strategiczny proces mający objąć całość danej organizacji czy przedsięwzięcia, opartą na wykorzystaniu technologii cyfrowych w celu poszukiwania przewag konkurencyjnych. Różnica między transformacją i remediacją polega zatem [..]Remediacja wydawnictwa drukowanego (1998-2001)
Poprzedni fragment „Polska Bibliografia Literacka” w swoim zamierzeniu stanowi bibliografię bieżącą o bardzo szerokim zakresie. Swym zasięgiem obejmuje polskie teksty literackie i paraliterackie (opublikowane zarówno w postaci druków zwartych, jak i na łamach czasopism krajowych [..]