Rozwój infrastruktury literaturoznawczej
Dariah.lab jest dobrym przykładem infrastruktury tworzonej do wsparcia konkretnej dyscypliny i zadań badawczych. Oprócz stworzenia poszczególnych elementów infrastruktury kluczowa jest praca konceptualna nad całościowym kształtem docelowej literaturoznawczej infrastruktury badawczej. W założeniu model zastosowany w Dariah.lab powinien być skalowany i stanowić wkład lub podstawę międzynarodowych inicjatyw infrastrukturalnych.
KDL stanowi istotne uzupełnienie takich inicjatyw korpusowych, jak DraCor czy ELTeC o komponent literaturoznawczy. Narzędzia ekstrakcji danych dziedzinowych i ich implementacja w narzędziu analitycznym GoLEM dostosowują i rozwijają metody NLP wykorzystywane w projektach takich, jak CLS INFRA. Infrastruktura TEI.NPLP.PL to specjalistyczne narzędzie tworzenia ustandaryzowanych naukowych edycji cyfrowych. European Literary Bibliography to nowa otwartościowa inicjatywa bibliograficzna wykorzystująca dane bibliografii specjalistycznych i narodowych, które wykorzystywane są w badaniach nad europejskimi systemami literackimi. Inspire pozwala na gromadzenie społeczności i jej interakcję. Infrastruktura Dariah.lab jako inicjatywa całościowej cyfryzacji procesu badawczego może stanowić podstawę realizacji większej inicjatywy międzynarodowej lub dobrze się w nią wpisywać.
Budowa całościowej infrastruktury, odpowiadającej na różne potrzeby badawcze na wszystkich etapach procesu badawczego wiąże się też z konkretnymi wyzwaniami, które trzeba brać uwagę na etapie planowanie:
- zapewnienie semantycznej i technicznej interoperacyjności narzędzi i serwisów;
- wielojęzyczność i jej wpływ na skuteczność i porównywalność efektów zastosowania metod przetwarzania języka naturalnego,
- umożliwienie prowadzenia badań nad całą historią literatury i badań literackich poprzez skuteczne łączenie badań na metadanych i pełnych tekstach.
Istotnym zagadnieniem jest także trwałość (sustainability) infrastruktury, czyli formy zapewnienia funkcjonowania infrastruktury i jej bieżącej aktualizacji. Trwałość ma wymiar technologiczny (oprogramowanie, zabezpieczenia, serwery), jak i intelektualny (treść, zastosowane metody, błędy merytoryczne). Zapewnienie trwałości jest często zadaniem kosztownym, stąd też duża waga współpracy z dużymi infrastrukturami i instytucjonalne usankcjonowanie danych przedsięwzięć.