Národní digitální archiv

Název projektu: Národní digitální archiv (NDA)

Číslo projektu: CZ.1.06/1.1.00/10.06977

Cíl projektu: Vybudování servisního pracoviště, zajišťujícího:

  • dlouhodobé uchování digitálních archiválií vybraných veřejnými archivy
  • provoz archivního portálu
  • zpřístupnění dokumentů
  • podporu institucí (původců) a archivů při skartačním řízení
  • podporu při zpracování digitálních archiválií
  • bezpečné uložení digitálních reprodukcí tradičních archiválií

Historie projektu — Výhody — Legislativa —  Technické řešení


 

Národní archiv

Národní archiv je ústředním archivem České republiky. Ve svém poslání přímo navazuje na činnost ústředních archivních institucí českého státu s kontinuitou sahající až do období raného středověku. Národní archiv na základě platných právních norem (zákon č. 499/2004 Sb., o archivnictví a spisové službě ve znění pozdějších předpisů) zajišťuje celou řadu správních a odborných činností.

 

Úloha archivů

Základním posláním archivů, jako součásti veřejné správy, je uchovat a zpřístupnit informace pro současné a budoucí potřeby společnosti.

 

Uchování elektronických dokumentů

Uchovávání a zpřístupňování informací v tradiční („papírové“) podobě se opírá o mnohaleté zkušenosti a spolehlivě vyřešeno. Zcela jiná je však situace v oblasti uchovávání a zpřístupňování digitálních informací. Zásadním trendem posledních let je aktivní elektronizace státní správy. To má přímý dopad i na tvorbu a zacházení s dokumenty. S neustále se zvyšujícím podílem elektronicky vedených agend u úřadů roste potřeba dlouhodobého zabezpečení těchto informací pro budoucí potřeby veřejnosti. Povinnost uchovat tyto dokumenty je pro státní správu komplexní a trvalá. Zahrnuje jak systémová opatření na straně původce dokumentu (konkrétního úřadu), který za něj nese zodpovědnost od chvíle vzniku po předání do archivu, tak na straně příslušného archivu, jenž musí zajistit jeho uchování po neomezeně dlouhou dobu a zároveň musí v souladu s platnou legislativou, poskytovat přístup k těmto informacím (subjektům veřejné správy a veřejnosti např. přes Portál veřejné správyCzech POINT apod.).

 

Potřeba archivu digitálních dokumentů

V současné době neexistuje v České republice žádný institut pro dlouhodobé uchovávání a zpřístupňování digitálních informací vzniklých primárně elektronicky, ale i digitalizovaných z tradiční analogové („papírové“) formy.

Projekt Národní digitální archiv (dále též NDA) naplňuje strategii efektivní veřejné správy (Smart Administration — Efektivní veřejná správa a přátelské veřejné služby). Cílem je přiblížit veřejné služby občanům a zajistit jejich maximální dostupnost a kvalitu. Dále má projekt NDA vazbu na Strategii rozvoje služeb pro informační společnost — prioritní oblast Digitalizace datových fondů a jejich archivace. Také napojení na Portál veřejné správy bude významným obohacením a jednou z důležitých podmínek naplnění myšlenky Smart Administration v rámci elektronizace služeb veřejné správy. Přístup uživatelů k uloženým archiváliím bude totiž řešen přes archivní portál, určený pro podporu zpracování a zpřístupnění uchovávaných archiválií a údajů o nich. Ten bude propojen se stávajícími informačními systémy archivů a veřejné správy (Portál veřejné správy, Czech POINTapod.) a dále bude napojen na systémy ostatních paměťových institucí (knihoven a muzeí), a to jak na národní, tak v budoucnu i na mezinárodní úrovni.

Přestože v současné době narůstá podíl elektronických dokumentů, nedůvěra v tyto dokumenty stále přetrvává. Příčinou jsou hlavně nejasná pravidla pro jejich střednědobé a dlouhodobé uchovávání a zajištění jejich věrohodnosti. Zatímco tedy tradiční dokumenty archivy vybírají a ukládají ve svých depozitářích, výběr a uchovávání digitálních archiválií téměř neexistuje.

Současný stav v oblasti péče o elektronické dokumenty a digitální ochrany v České republice zaostává za jinými evropskými zeměmi. Hlavními důvody této situace dosud byly nedostatek finančních zdrojů a nejasná metodika pro standardizaci procesů správy elektronických dokumentů ze strany veřejné správy. Aktuální stav řešení problémů spojených s dlouhodobým ukládáním a zpřístupňováním elektronických archiválií v českém prostředí přitom neodpovídá podmínkám nového legislativního rámce nastaveného v roce 2009.

Vzhledem k relevanci této tematiky k cílům prosazovaným a podporovaným Integrovaným operačním programem (dále též IOP) strukturálních fondů Evropské unie v letech 2007–2013 připravil Národní archiv projekt Národní digitální archiv, jehož cílem je:

  • vybudování pracoviště schopného zajistit komplexní, dlouhodobé, bezpečné a důvěryhodné uchovávání elektronických dokumentů trvalé povahy (elektronických archiválií),
  • vybudování fyzického úložiště elektronických archiválií, které bude schopné reagovat na neustálý rozvoj technologií a rostoucí objem počtu a rozsahu elektronických dokumentů a tedy i elektronických archiválií,
  • vybudování jednotného informačního systému Národního digitálního archivu modulárního, udržitelného a snadno rozšiřitelného pro zajištění dlouhodobé správy elektronických dokumentů,
  • vytvoření celostátního archivního portálu pro podporu zpracování a pro zpřístupnění uchovávaných archiválií a údajů o archiváliích. Cílem je jeho propojení se stávajícími informačními systémy veřejné správy (Portál veřejné správy, Czech Point apod.), archivů a ostatních paměťových institucí (knihoven a muzeí) na národní i mezinárodní úrovni,
  • vypracování komplexní metodiky pro standardizaci procesů správy elektronických dokumentů = budoucích archiválií na straně veřejné správy,
  • definice pravidel pro výběr a zpracování elektronických archiválií veřejnými archivy,
  • zajištění bezpečného uchování digitálních reprodukcí archiválií včetně metodické podpory v oblasti digitalizace.

 


 

Historie projektu

S využitím počítačů v podnikání a státní administrativě roste počet digitálních dokumentů a potřeba jejich bezpečného dlouhodobého uložení.

Při Národním archivu v Praze proto vzniká Pracoviště pro dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě — Národní digitální archiv (NDA). Jeho úkolem je mimo jiné najít odpověď na otázku: Jak nakládat s digitálními dokumenty, aby byly i s odstupem času dostupné, čitelné a důvěryhodné?

 

První úvahy

O možnostech digitální archivace se v českém archivnictví začalo uvažovat v polovině devadesátých let 20. století. Následně vznikly konkrétní výzkumné projekty realizované za účasti Odboru archivní správy MV, ČVUT a Národního archivu v letech 2001–2005. Dílčí zprávy byly publikovány na stránkách Archivního časopisu.

 

Usnesení vlády č. 11/2004

Konkrétní podobu úvahy o digitální archivaci dostaly v  usnesení vlády č. 11   ze 7. ledna 2004. Tímto usnesením vláda uložila místopředsedovi vlády a ministru vnitra zpracovat ve spolupráci s ministrem informatiky projekt dlouhodobého uchovávání a zpřístupňování dokumentů v digitální podobě. V předkládací zprávě usnesení byla nejen konstatována a zdůvodněna nutnost řešit dlouhodobé uchovávání digitálních dokumentů, ale rovněž byl určen postup směřující k vybudování digitálního archivu. Nejprve měl být při Národním archivu sestaven tým, který připraví podklady pro zpracování projektu. Na jeho základě pak měl být vybudován digitální archiv.

Naléhavost řešení dlouhodobého uchovávání byla zdůrazněna rozvojem eGovernmentu, jehož projekty jsou bez vyřešení digitální archivace jen obtížně realizovatelné. Existenci digitálního archivu předpokládal například i Národní plán zavedení elektronického zadávání veřejných zakázek pro období let 2006 až 2010 (vládní usnesení č. 500 z 10. května 2006).

 

Příprava projektu

Tým pro přípravu digitálního archivu byl v Národním archivu ustaven na konci roku 2005. V průběhu roku 2006 shromáždil podklady a vypracoval zadávací dokumentaci. Na jejím základě Národní archiv vyhlásil výběrové řízení na zpracovatele projektu digitálního archivu. Vítěz tendru následně (v období od července 2007 do února 2009) zpracoval technologický projekt Pracoviště pro dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě. Projekt byl dokončen a předán v březnu 2008.

V dubnu 2008 vláda svým usnesením č. 447, k zabezpečení plnění úkolů ve věci vybudování Národního digitálního archivu, schválila čerpání finančních prostředků na vybudování Národního digitálního archivu a uložila ministru vnitra nárokovat finanční prostředky ve výši 85% nákladů projektu z evropských strukturálních fondů v rámci Integrovaného operačního programu. Následně pak byl projekt Národního digitálního archivu uveden v příloze vládního usnesení č. 536 ze 14. května 2008, o strategických projektových záměrech pro čerpání finančních prostředků ze strukturálních fondů Evropské unie v rámci Smart Administration — příloha ke strategii Efektivní veřejná správa a přátelské veřejné služby.

 


 

Výhody

Oproti současnému stavu přinese digitalizace archiválií řadu výhod všem cílovým skupinám projektu.

 

Výhody pro původce (úřady a další subjekty veřejné správy a soukromého sektoru)

Původci archiválií získají realizací tohoto projektu možnost dlouhodobého uložení digitálních dokumentů způsobem, který neohrozí důvěryhodnost těchto dokumentů v čase.Díky dálkovému přístupu pak budou moci snadno a rychle tyto dokumenty vyhledávat a efektivně je využívat pro svou činnost.

Jde především o:

  • veřejnoprávní původce, tedy subjekty s povinností vést spisovou službu, případně vyřazovat dokumenty ve skartačním řízení dle zákona č. 499/2004, Sb.

Vybrané dokumenty této skupiny jsou předávány akreditovaným veřejným archivům k trvalému uložení. Počet těchto dokumentů v digitální podobě (především s rozvojem eGovernmentu) neustále narůstá.

  • soukromoprávní původce, tedy subjekty bez povinnosti vést spisovou službu

Některé z nich mají za povinnost umožnit výběr archiválií (subjekty zapsané v OR, politické strany, občanská sdružení, nadace, příp. významné fyzické osoby).

  • orgány činné v trestním řízení a soudy

Projekt napomůže zvýšení důvěryhodnosti elektronických dokumentů po celou dobu jejich životního cyklu a použitelnosti dokumentů jako důkazních materiálů v soudním řízení.

  • zaměstnance veřejné správy pro potřeby výkonu svěřených agend

Výsledky projektu umožní snadno a rychle vyhledat archivní dokumenty a získat jejich digitální či digitalizované reprodukce.

 

Výhody pro veřejné archivy

Veřejné archivy získají možnost garantovaného uložení digitálních archiválií a reprodukcí archiválií. Díky zvolenému řešení nebude nutné budovat u každého archivu samostatné datové úložiště (finančně i personálně náročné). Archivní portál v důsledku umožní kvalitnější výkon veřejné správy v oblasti informací o archivních dokumentech i samotné zpřístupňování a předkládání těchto dokumentů.

Archivy v současnosti nejsou technicky, ani personálně připraveny na trvalé uchovávání, zpřístupňování a předkládání elektronických dokumentů přesto, že tato činnost je požadována a nařízena příslušnou legislativou.

Úkolem archivářů je provádět výběr, zpracování, zpřístupňování a předkládání archiválií. V současnosti však nemohou sami formulovat pravidla pro provádění výběru elektronických archiválií, tento výběr provést, a elektronické dokumenty zpracovat. Projekt NDA umožní nastavit jejich pracovní prostředí tak, aby byla zajištěna efektivní práce s elektronickými archiváliemi a omezily se duplicitní činnosti.

 

Výhody pro veřejnost

Národní digitální archiv bezplatně zprostředkuje veřejnosti přístup k digitálním archiváliím či digitálním reprodukcím kdykoli a odkudkoli pomocí internetu.

Z připravovaného projektu budou profitovat především:

  • občané ve větší vzdálenosti od příslušných archivů, občané s pohybovým hendikepem

Archivní portál umožní studium záznamů o archiváliích i samotných archiválií pomocí dálkového přístupu (prostřednictvím internetu). Pro občany, kteří nedisponují vlastním přístupem k internetu je ve většině obcí k dispozici v místních knihovnách.

  • firmy a živnostníci

Digitalizace archiválií vytvoří podnikatelům další dostupný zdroj informací (např. technických, o výsledcích výzkumu, atd.).

  • soukromí badatelé

Studenti, historici i „amatérští“ badatelé s využitím archivního portálu naleznou vyhledávané informace na dostupném místě (počítač s přístupem k internetu), navíc rychleji (on-line, bez ohledu na provozní dobu archivu) a levněji (dopravní náklady).

  • středoškolští a vysokoškolští pedagogové

Archiválie mohou využít především učitelé humanitních oborů pro příklad některých historických událostí.

 


 

Legislativa

Zákon č. 499/2004 Sb., o archivnictví a spisové službě („archivní zákon“), Platné znění (PDF – 350 kB)

Úplné znění Zákona o archivnictví a spisové službě (PDF – 0,98 MB)

Důvodová zpráva k návrhu novely archivního zákona (PDF – 613 kB)

Vyhláška č. 259/2012 Sb., o podrobnostech výkonu spisové služby, ve znění pozdějších předpisů („spisová vyhláška“) – Spisová vyhláška (PDF – 122 kB)

Důvodová zpráva k návrhu spisové vyhlášky (PDF – 253 kB)

 


 

Technické řešení

Navržené řešení digitálního archivu vychází ze standardu OAIS (ISO 14721:2003 — Open Archival Information System). Tento standard vymezuje základní koncepci archivu pro uložení elektronických dokumentů a je na něm budována většina současných digitálních archivů. Standard definuje hlavní funkce, které má archiv zajišťovat. Jedná se o příjem, správu dat, archivní uložení, přístup, administraci a plánování uchovávání. Základní model OAIS je na obrázku.

Podle standardu OAIS jsou elektronický dokument a všechny informace (metadata) zabaleny do balíčku s jednotnou strukturou. Tyto balíčky jsou podle standardu OAIS nazývány:

  • SIP — Submission Information Package (balíčky přijímané od původců),
  • AIP — Archival Information Package (archivní balíčky zahrnující ukládaný obsah a jeho příslušné popisné informace pro uchovávání — metadata) a
  • DIP — Dissemination Information Package (balíčky vytvořené na základě badatelského dotazu, pro využívání).

Základní navržené schéma digitálního archivu je následující:

Digitální dokument, který bude archivářem vybrán za archiválii, bude nejprve připraven u původce do podoby vhodné pro předání do archivu, tzn. bude vytvořen balíček SIP. Balíček bude většinou automaticky generován elektronickým systémem spisové služby. Do balíčku bude zahrnut nejen dokument, ale i metadata, která se k němu váží a která byla pořizována během celého dosavadního životního cyklu dokumentu.

Zaslaný balíček bude v archivu nejprve umístěn do karantény. To znamená, že bude zkontrolován, zda soubory neobsahují škodlivý kód (viry apod.). Kontrola proběhne dvakrát s časovým odstupem třiceti dnů. Pokud dokument nebude obsahovat škodlivý kód, proběhne další kontrola balíčku. Zejména bude kontrolován formát souborů a rozsah vyplnění metadat. Jestliže balíček bude obsahovat škodlivý kód, nevhodný formát souborů či nebude obsahovat požadovaná metadata, bude odmítnut a původce bude o této skutečnosti informován.

Přijatý balíček bude dále zpracováván. Zejména budou doplněna metadata podporující procesy řízení uchovávání a zpřístupňování a dokumentu bude v rámci digitálního archivu přidělen jednoznačný identifikátor. Výsledkem celého procesu bude archivní informační balíček — AIP (všechna metadata a vlastní digitální soubory). Tento balíček bude následně uložen do archivního úložiště s řízeným přístupem, aplikací uchovávacích metod apod.

V průběhu prací na technologickém projektu bylo potřeba řešit otázku dokumentů, které nejsou digitálními archiváliemi v pravém slova smyslu, ale které by bylo vhodné rovněž uchovat. Jako řešení byl do schématu archivu zařazen mezisklad digitálních dokumentů, takzvané Chráněné úložiště. Zejména v počátcích digitálního archivu zde mohou být uchovávány balíčky, které původce zaslal do archivu, ale které nesplňují předepsaná kritéria. Takový balíček bude původci buď rovnou vrácen nebo bude uložen v úložišti a původce ho ve spolupráci s archivem opraví (doplní). Též může jít o dokumenty — potenciální archiválie — s dlouhými skartačními lhůtami, které archiv pomůže původci dlouhodobě uchovat. Dalším způsobem využití úložiště je uchování digitálních obrazů klasických archiválií.

Do archivního úložiště ani do chráněného úložiště nebude možno ukládat nepopsané dokumenty. Každý dokument musí být opatřen alespoň základními metadaty (původce, identifikátor, datum vzniku, název, spisový plán, obsah, informace na základě čeho je ukládán). V počátcích digitálního archivu budou pravidla pravděpodobně benevolentnější, ale ani tehdy nebude možný prostý přesun dat z disku u původce do digitálního archivu.

 

Zpřístupnění uložených dokumentů

Nedílnou součástí digitálního archivu je zpřístupnění uložených dokumentů. Zpřístupnění bude probíhat pomocí webového portálu Národního digitálního archivu, jehož prostřednictvím zadá uživatel svůj požadavek. Modul přístup následně žádost zpracuje, vytvoří DIP (Dissemination Information Package), který bude uživateli zobrazen prostřednictvím webového portálu. DIP může v závislosti na uživatelském požadavku obsahovat seznam přístupných dokumentů a jejich náhledy, konkrétní dokument a jeho metadata, informaci o eventuálním omezení přístupnosti dokumentu apod.

 

Způsob uchování

Na rozdíl od archivace klasických listinných dokumentů je způsob uchování digitálních dokumentů komplikovanější. Pro interpretaci digitálního dokumentu vždy potřebujeme technický prostředek, který dokument převede z binární do čitelné podoby. Při uchování dokumentu tedy musíme zajistit nejen vlastní zachování dokumentu (uložení dat), ale i jeho čitelnost (přesná interpretace uložených dat).

 

Zachování dokumentu

Proti ztrátě bude dokument v archivním úložišti zajištěn uložením na dvou geograficky oddělených místech za použití dvou typů médií s rozdílným fyzikálním principem. Jedno pracoviště obsahující chráněné úložiště a primární archivní úložiště digitálního archivu bude nově vybudováno v Praze v sousedství Národního archivu. Záložní pracoviště bude obsahovat sekundární archivní úložiště a pro jeho umístění bude využit stávající objekt. Obě úložiště budou od sebe vzdálena 100 km. Jako ukládací média archivních úložišť jsou v technologickém projektu navržena disková pole (magnetický princip záznamu) a UDO disky (optický princip záznamu) a jako ukládací média chráněného úložiště technologický projekt uvádí diskové pole zálohované na pásky.

 

Čitelnost dokumentu, formáty, migrace a emulace

Prosté zachování dokumentu ještě nezaručuje, že dokument bude možno interpretovat (číst). Vývoj formátů souborů používaných k záznamu informací je velmi dynamický, což přináší pro dlouhodobé uchovávání problémy. Z možných řešení zajištění dlouhodobé čitelnosti dokumentů uložených v digitálním archivu (emulace, migrace, virtualizace) byla zvolena metoda migrace. Jejím principem je přizpůsobení dat prostředí. Dokumenty uložené ve formátech, které nebudeme schopni interpretovat, se převedou do jiného (vhodnějšího) formátu. Nelze samozřejmě předpokládat, že v současné době lze touto metodou řešit dlouhodobé uchování veškerých digitálních dokumentů. To ostatně nedokáže zajistit žádná metoda. Migrace se však aktuálně jeví jako velmi efektivní způsob zachování čitelnosti většiny digitálních dokumentů. Prostřednictvím relativně levných migračních nástrojů lze dosáhnout převodu mnoha formátů primárních dokumentů do menšího množství formátů vhodných pro dlouhodobé uchovávání. Čím bude množství formátů menší, tím bude dlouhodobé uchovávání snazší, byť existuje určité riziko v případě, že formát pro dlouhodobé uchovávání bude nevhodně zvolen.

Pro každý formát dokumentu přebíraného do archivu musí mít digitální archiv vypracovánu uchovávací strategii. Pokud taková strategie neexistuje neměl by být dokument převzat. V technologickém projektu jsou posouzeny některé formáty a došlo k jejich rozdělení do tří skupin: preferované, akceptované, neakceptované (s nízkou životností). Při posuzování formátů byla zohledněna tato kritéria: otevřenost, rozšířenost, transparentnost (jednoduchost uložení informací v dokumentu), sebedokumentace, vnější závislosti, vliv patentů, ochranné mechanismy. Rozdělení do jednotlivých skupin je patrno z tabulky.

typ dokumentu preferované formáty akceptovatelné formáty formáty s nízkou trvanlivostí
textový dokument prostý text, XML struktura, PDF A/1a OpenDocument, OpenOffice 1.0, Rich Text Format 1.X, Office Open XML MS-Word, Text602, 602 PC Suite, Amipro, WordPerfect
tabulky Delimited text (CSV) PDF OpenDocument, Office Open XML MS-Excel, Calc602, Lotus
prezentace PDF, OpenDocument, Office Open XML MS-PowerPoint
rastrová grafika TIFF, PNG BMP. JPEG, JPEG2000. TIFF (komprimovaný LZW, JPEG), GIF TIFF (jiná komprese), PCX, interní formáty grafických aplikací
vektorová grafika SVG 1.1 (bez Javy) Computer Graphic Metafile interní formáty grafických aplikací
zvukové dokumenty WAV, AIFF. Broadcast Wave MP3, MP2, OGG Vorbis Windows Media Audio, RealNetworks
video dokumenty MPEG-l, MPEG-2, QuickTime, AVI (nekomprimované) OGG Theora, MPEG-4 AVI, QuickTime (komprimované), Windows Media Video, RealNetworks

 

Preferované formáty jsou vhodné pro dlouhodobé uchovávání a budou přebírány do archivu bez migrace.

Akceptované formáty jsou pro dlouhodobé uchovávání méně vhodné, ale není nutno je v okamžiku předání migrovat do formátů preferovaných. Vyžadují však zvýšenou pozornost.

Formáty ze skupiny neakceptovaných musí být nejpozději při předání do archivu migrovány nejlépe na preferovaný nebo alespoň na akceptovaný formát. Nejvhodnějším okamžikem pro převod dokumentu do preferovaného formátu se jeví okamžik jeho vyřízení (uzavření) u původce.

Stanovení preferovaných formátů však neznamená, že dokumenty musí vznikat pouze v nich. Dokument může být vytvářen v libovolném formátu, ale ve výše uvedeném okamžiku životního cyklu by měl být převeden do preferovaného formátu. Například u rastrové grafiky mohu použít formát GIMP či Photoshopu, který umožní plně využít vlastnosti editoru (např. vrstvy), ale poté je vhodný převod do PNG či TIFF. Podobně lze úřední dopis ukládat po dobu tvorby ve formátu MS-Office, a teprve v okamžiku uzavření (spisu apod.) ho převést do PDF/A.

V současné době jsou stanoveny výstupní datové formáty statických dokumentů v digitální podobě ze systémů spisové služby vykonávaných elektronickou formou za použití výpočetní techniky a datový formát statických dokumentů v digitální podobě připravovaných pro předání do Národního digitálního archivu. Jedná se o formát PDF/A-1a (ISO 19005-1 — Portable Document Format — Electronic document fileformat for long-termpreservation) pro statické textové, obrazové a kombinované dokumenty v digitální podobě a o formáty PNG (ISO/IEC 15948:2004 — Portable Network Graphics) a TIFF (Tagged Image File Format — revize 6 — nekomprimovaný) pro statické obrazové dokumenty v digitální podobě.

 

Autenticita

V rámci technologického projektu je autenticita chápána jako prokázání, že dokument je tím, čím má být, že nebyl v průběhu uložení v digitálním archivu změněn a že procesem migrace nedošlo ke ztrátě žádné podstatné informace.

Zvoleným principem zachování autenticity v Národním digitálním archivu je fyzické a procesní zajištění uložených dokumentů oproti změně a transparentní, dokumentovaný způsob migrace. To vyžaduje certifikaci digitálního archivu jako důvěryhodného úložiště. Projekt předpokládá certifikaci archivu třetí stranou, že splňuje požadavky takového úložiště, a to jak po stránce fyzické bezpečnosti, tak po stránce procesní, včetně zajištění dostatečných finančních prostředků pro jeho dlouhodobou činnost. Certifikace proběhne podle aktuálních standardů, či předpisů. Jednou z navržených možností je posouzení archivu Národním bezpečnostním úřadem.

Archiv bude považovat dokumenty předané původcem za autentické a zachová informace, jakými prostředky a s jakým výsledkem byla certifikace ověřena. Například u dokumentu podepsaném zaručeným elektronickým podpisem bude zachována informace, kdo dokument podepsal, že byl podpis ověřen a s jakým výsledkem. Dokument pak bude uložen v archivu spolu s těmito informacemi, ale v podstatě nepodepsaný. Autenticita dokumentu po uložení v archivu bude zajištěna vnitřními prostředky archivu.

Platný zaručený elektronický podpis (či elektronická značka) autora dokumentu (i s časovým razítkem odeslání) má svůj význam v prvotních fázích životního cyklu digitálního dokumentu, kdy po určitou dobu potvrzuje autenticitu digitálního dokumentu. Jeho použití se jeví žádoucí maximálně do chvíle přijetí dokumentu do digitálního archivu. Je na původci, aby ověřil primární autentizační údaje o dokumentu a výsledek ověření uvedl do popisných metadat. Součástí metadat informačního balíčku je sekce pro vložení údajů o ověření elektronického podpisu. Projekt počítá s použitím elektronického podpisu na úrovni NDA pouze pro kontrolu integrity dat při přenosu od původce ke zpracování.

 

Metadata

Při dlouhodobém uchovávání digitálních dokumentů nestačí jen zajistit, aby byl dokument zachován a čitelný. K dokumentu je potřeba rovněž uchovat další informace, tzv. metadata. Metadata nám například pomohou zařadit dokument do kontextu doby jeho vzniku, poskytnou údaje o manipulaci s dokumentem, informují o formátu, v němž je dokument uložen apod.

V souladu s OAIS budou všechna metadata uložena spolu s dokumentem v rámci AIP (Archival Information Package).

Množinu metadat je možno rozdělit na tři hlavní skupiny: metadata popisná, konzervační (uchovávací) a strukturální. Při stanovení prvků metadat se vychází z mezinárodních norem a doporučení, které jsou v případě potřeby doplněny metadaty specifickými pro české prostředí. To se týká hlavně popisných metadat.

Popisná metadata (například název, popis, autor, původce, typ, kategorie, a další) slouží převážně pro vyjádření obsahu digitálních dokumentů a jsou využívána pro vyhledávání nebo zatřídění objektu a k zjištění základních údajů o něm. Ačkoli mohou vznikat po celou dobu života dokumentu, vznikají hlavně ve dvou etapách životního cyklu: ve fázi příjmu a zpracování u původce a při archivním zpracování.

Fáze příjmu a zpracování u původce je pro vznik popisných metadat klíčová. Popisná metadata, která nebudou zachycena v této fázi životního cyklu, bude později velmi pracné, ne-li nemožné, doplnit. Je však třeba uvést, že záznam popisných metadat neznamená nárůst zátěže pracovníků, kteří s dokumenty pracují. Všechna metadata, která je potřeba zaznamenat, se již dnes k dokumentu běžně evidují (spisový znak, pořadové číslo, rok záznamu, odesílatel, příjemce apod.), případně je generuje systém správy dokumentů (ERMS) automaticky (systémový identifikátor,datum přijetí atd.). Z řečeného vyplývá, že systémy spisové služby a jim podobné informační systémy mají při vkládání popisných metadat nezastupitelnou roli.

Druhým okamžikem, ve kterém dojde k rozsáhlejšímu zadávání popisných metadat, je fáze archivního zpracování. Tato fáze není v současnosti příliš rozpracována, což je ale logické. Nejprve je potřeba dokumenty uchovat a teprve následně mohou být zpracovávány. Již dnes je však možno říci, že nutnost archivního zpracování je nepřímo úměrná kvalitě popisu dokumentu u původce. Čím kvalitnější bude popis, o to menší bude potřeba archivního zpracování.

Popisná metadata vycházejí z doporučení Moreq2 vypracovaného organizací DLM fórum. Uvedené doporučení je předlohou připravovaného Národního standardu pro elektronické systémy spisové služby, který je adaptací Moreq2 na české prostředí a jehož součástí budou i definice metadatových prvků. Na úrovni archivního zpracování budou využívány standardy ISAD(G), ISAAR(CPF), EAD, EAC a množina popisných metadat bude rozšířena o prvky, které z těchto standardů vyplývají.

Konzervační metadata slouží pro podporu uchovávání a rchivačních aktivit. Obsahují údaje o formátu souboru, ve kterém je dokument uložen, technické údaje o uložených digitálních objektech, informace o činnostech či změnách provedených s digitálním obsahem, o migracích dokumentu apod. Tato metadata budou rovněž vznikat po celou dobu životního cyklu dokumentu, převážně však v digitálním archivu. Je to logické, neboť digitální dokumenty trvalé povahy (digitální archiválie) budou větší část svého životního cyklu uloženy v archivu.

Uchování informace o formátu, ve kterém je dokument uložen, je zásadní pro případné znázornění dokumentu a pro volbu správného okamžiku a vhodného způsobu migrace. Informace o změnách dokumentu (vytvoření nového znázornění, migrace) a o manipulaci s ním nám poskytnou podporu při zajištění autenticity. Na základě důvěryhodnosti archivu a jeho schopnosti doložit veškeré operace s dokumentem pak bude možno usuzovat i na věrohodnost dokumentu.

Podobně jako u popisných metadat bude základ konzervačních metadat vycházet z Národního standardu pro elektronické systémy spisové služby. Tato základní množina pak bude rozšířena o metadata standardu PREMIS. K udržování informací o formátu souborů pak bude použit online registr formátů PRONOM.

Strukturální metadata slouží pro sdružení všech částí informačního balíčku do jednoho logického celku. Ukazují, jak spolu jednotlivé součásti dokumentu souvisí. Jak již bylo uvedeno, bude dokument v archivu uložen spolu se souvisejícími metadaty v rámci tzv. archivního informačního balíčku (AIP). Nelze však říci, že jeden AIP bude tvořen právě jedním dokumentem. AIP může být tvořen spisem a v takovém případě může obsahovat i několik dokumentů. Dokument sám pak nemusí být uložen v jednom souboru, ale může sestávat z několika souborů (komponent). Podobná situace je u metadat, která se mohou vztahovat k celému archivnímu balíčku, případně bude každý objekt (spis, dokument, komponenta) obsahovat svá vlastní metadata. Závislosti a vztahy jednotlivých částí popisují právě strukturální metadata.

Struktura informačního balíčku je definována normou OAIS. Pro jeho zápis bude využit standard METS a strukturální metadata budou vycházet právě z tohoto standardu.