Český národní uzel EHRI v rámci digitální výzkumné infrastruktury pro jazykové technologie, umění a humanitní vědy LINDAT/CLARIAH-CZ

Projekt velkých výzkumných infrastruktur

Identifikační kód projektu: LM2023062

Doba řešení: 2023–2026

PŘÍJEMCE – KOORDINÁTOR PROJEKTU

Univerzita Karlova / Matematicko-fyzikální fakulta

Prof. RNDr. Jan Hajič, Dr.

DALŠÍ PŘÍJEMCI

Česká republika – Národní archiv

Filosofický ústav AV ČR, v. v. i.

Historický ústav AV ČR, v. v. i.

Institut Terezínské iniciativy, o. p. s.

Knihovna AV ČR, v. v. i.

Masarykova univerzita / Filozofická fakulta

Masarykova univerzita / Fakulta informatiky

Masarykův ústav a Archiv AV ČR, v. v. i.

Moravská zemská knihovna v Brně

Národní filmový archiv

Národní galerie v Praze

Národní knihovna České republiky

Památník Terezín

Univerzita Karlova / Filozofická fakulta

Ústav pro jazyk český AV ČR, v. v. i.

Západočeská univerzita v Plzni / Fakulta aplikovaných věd

POPIS PROJEKTU:

Velká výzkumná infrastruktura LINDAT/CLARIAH-CZ představuje český národní uzel panevropských výzkumných infrastruktur CLARIN-ERIC (Common Language Resources and Technology Infrastructure), DARIAH-ERIC (Digital Research Infrastructure for the Arts and Humanities) a EHRI-ERIC (European Holocaust Research Infrastructure, ve stádiu přípravy).

LINDAT/CLARIAH-CZ shromažďuje, zpracovává, anotuje (manuálně i automaticky) a uchovává jazyková, multimediální a jiná data související s českým jazykovým prostředím, a to i z historického hlediska. Zároveň zprostředkovává otevřený přístup nejen k těmto datům, ale i k technologiím, relevantním zejména pro humanitní a společenské obory a související interdisciplinární výzkum (např. formální a počítačová lingvistika, translatologie, lexikografie, psychologie, sociologie, neurolingvistika, kognitivní vědy nebo umělá inteligence). V oblasti umění a humanitních oborů aplikujících digitální metody jde mj. o literaturu a literární vědy, historii včetně zdrojů orální historie a výzkumu holokaustu a genocid 20. století, historickou bibliografii, kulturu a vědu o kultuře, historii umění, filosofii, film a filmovou historii včetně nových médií a jejich analýzy, vizuální umění, muzikologii a historii hudby, etnologii, folklór, archeologii, egyptologii a interdisciplinární obory v jejich kombinaci, včetně kombinace s moderními technologiemi.

LINDAT/CLARIAH-CZ se významně spolupodílí na vývoji datového repozitáře CLARIN DSpace, který poskytuje spolupracujícím organizacím na národní i mezinárodní úrovni. Hlavním cílem infrastruktury je zpřístupnit – v otevřeném režimu – digitalizované datové zdroje v uvedených oborech široké vědecké komunitě, a to včetně softwarových služeb nutných k efektivnímu využití těchto zdrojů. Součástí programu infrastruktury jsou také vzdělávací aktivity.

Skupina EHRI-CZ – český národní uzel Evropské infrastruktury pro výzkum holokaustu

Partnerskými institucemi je vedle Národního archivu Masarykův ústav a Archiv AV ČR, Památník Terezín a Institut Terezínské iniciativy

Národní archiv
Koordinátor: Mgr. Monika Václavíková

Náplň projektu:
  • Dílčí projekt s názvem „Album přeživších z Prahy“, který dokumentuje osoby, jež byly v letech 1941–1945 deportovány hromadnými transporty z Prahy do Terezína a dalších koncentračních táborů a přežily holokaust. K datovému souboru osob získaného od partnerských institucí jsou připojovány data z archivních fondů uložených v Národním archivu – např. pobytové karty a spisy pražského policejního ředitelství (fond Policejní ředitelství Praha II), matriční záznamy (fond Matriky židovských náboženských obcí v českých krajích), transportní seznamy (fond Okupační vězeňské spisy) a další.
  • Úprava a doplňování popisů archivních fondů z ČR k problematice židovského holokaustu na mezinárodním portálu EHRI.
  • Výběr a digitalizace archivních pramenů vztahujících se k holokaustu pro výzkum automatického rozpoznávání textu.
Czech National Node of the EHRI in the Digital Research Infrastructure for the Language Technologies, Arts and Humanities LINDAT/CLARIAH-CZ

The large research infrastructure LINDAT/CLARIAH-CZ represents the Czech national node of the pan-European research infrastructures CLARIN-ERIC (Common Language Resources and Technology Infrastructure), DARIAH-ERIC (Digital Research Infrastructure for the Arts and Humanities) and EHRI-ERIC (European Holocaust Research Infrastructure, in the process of being prepared).

LINDAT/CLARIAH-CZ collects, processes, annotates (manually and automatically) and stores linguistic, multimedia and other data related to the Czech language environment, including from a historical perspective. At the same time, it provides open access not only to these data, but also to technologies, particularly relevant for the humanities and social sciences and related interdisciplinary research (e.g. formal and computer linguistics, translatology, lexicography, psychology, sociology, neurolinguistics, cognitive sciences or artificial intelligence). In the field of digital arts and humanities, which includes literature and literary sciences, history, including research on the Holocaust and genocides of the 20th century, historical bibliography, culture and science of culture, art history, philosophy, film and film history including new media and their analysis, visual arts, musicology and history of music, ethnology, folklore, archaeology, Egyptology and interdisciplinary research across them, including combination with modern technologies.

LINDAT/CLARIAH-CZ is significantly involved in the development of the CLARIN DSpace data repository, which it provides to cooperating organizations at the national and international level. The main objective of the infrastructure is to make digitized data resources in these disciplines available to the broad scientific community, including the software services necessary for the efficient use of these resources, in an open mode. The infrastructure program also includes educational activities.

In addition to the National Archives, the partner institutions are the Masaryk Institute and  Archives of the Czech Academy of Sciences, the Terezín Memorial and the Terezín Initiative Institute.

National Archives

Coordinator: Mgr. Monika Václavíková

The content of the project:
  • A partial project called “The Album of Prague Jewish Survivors”, which documents people who were deported from Prague to Terezín and other concentration camps in 1941–1945 and survived the Holocaust. The dataset of persons obtained from partner institutions is supplemented by data from archival fonds stored in the National Archives – e.g. residence cards and files of the Prague Police Headquarters, civil registry records, census sheets, transport lists, post war documents and others.
  • Editing and adding descriptions of archival collections from the Czech Republic on the issue of the Jewish Holocaust on the international EHRI portal.
  • Selection and digitization of Holocaust-related archival sources for research on automatic text recognition.