30. 9. 2024
Dne 1. 7. 2024 nabyla účinnosti novela zákona 499/2004 Sb. (dále jen Zákon), která otevírá prostor pro nová pravidla související s výběrem archiválií a správou informací u některých informačních systémů, které budou uvedeny do provozu po 31. 12. 2024.
Každý veřejnoprávní původce určený v § 63 odst. 3 Zákona musí mít svůj základní elektronický systém spisové služby (dále jen eSSL). Každý veřejnoprávní původce (§ 3 odst. 1 Zákona) může provozovat další elektronické samostatné evidence nebo jiné informační systémy, které nejsou eSSL.
Z hlediska Zákona a jeho prováděcích předpisů lze informační systémy rozdělit do 2 základních skupin:
Informační systémy, které nejsou eSSL a které se řídí §3a Zákonem, lze dále rozdělit na
Informační systémy v roli eSSL a v roli samostatné evidence podléhají regulaci v podobě postupů stanovených vyhláškou 259/2012 Sb., o podrobnostech výkonu spisové služby, a Národním standardem pro elektronické systémy spisové služby, a to v celém životním cyklu správy dokumentů od jejich vzniku po vyřazování a výběr archiválií. [1]
Informační systémy, které nejsou eSSL, a to včetně samostatných evidencí, legislativně nově spadají pod § 3a Zákona:
§3a
(1) Správce informačního systému, který není elektronickým systémem spisové služby, využívaného veřejnoprávním původcem zajišťuje, že tento informační systém umožňuje uchovávání informací v souladu s § 3 odst. 5. V případě informací, na které nebyl vydán trvalý skartační souhlas podle § 15 odst. 4, zajišťuje správce informačního systému podle věty první, že tento systém umožňuje výběr archiválií mimo skartační řízení. Na informační systém uvedený ve větě první se nevztahují požadavky stanovené tímto zákonem na elektronické systémy spisové služby. (2) Postupy, výstupní datové formáty a rozsah a podobu metadat pro účely výběru archiválií podle odstavce 1 stanoví Národní archiv a zveřejní je na svých internetových stránkách. |
Tyto informační systémy musí zajistit v celém životním cyklu správy dokumentů:
1) uchování informací v souladu s §3 odst. 5 Zákona, tzn. věrohodnost původu dokumentů, neporušitelnost jejich obsahu a čitelnost a tvorbu a správu metadat, a to do doby provedení výběru archiválií.
§3
(5) V případě dokumentů v digitální podobě se jejich uchováváním rozumí rovněž zajištění věrohodnosti původu dokumentů, neporušitelnosti jejich obsahu a čitelnosti, tvorba a správa metadat náležejících k těmto dokumentům v souladu s tímto zákonem a připojení údajů prokazujících existenci dokumentu v čase. Tyto vlastnosti musí být zachovány do doby provedení výběru archiválií. |
2) Dále musí umožnit provedení výběru archiválií mimo skartační řízení nebo umožnit aplikaci trvalého skartačního souhlasu podle § 15 odst. 4 Zákona.
3) Nevztahují se na ně požadavky NSESSS. Lze dovodit, že na dokumenty a informace spravované v těchto systémech se nevztahují požadavky popisující výkon spisové služby v §§ 63-70 Zákona; nevztahují se na ně požadavky vyhlášky 259/2012 Sb., o podrobnostech výkonu spisové služby, pokud se nejedná o samostatnou evidenci podle vyhlášky 259/2012 Sb.
4) Naopak ve fázi výběru archiválií se řídí postupy, které Národní archiv zveřejňuje na svých webových stránkách.
Viz také procesní model posouzení systému.
Tyto postupy lze po dohodě mezi původcem a archivem použít i na systémy uvedené do provozu před 31. 12. 2024.
Jedná se o informační systém, který veřejnoprávní původce využívá k výkonu některých specializovaných činností, kterým je systém přizpůsoben na míru vyvinutými funkcemi, automatizovanými postupy, speciálními nástroji např. pro práci s příslušnými datovými formáty, jedinečnými formáty vstupních dat (např. specifická xml schémata, JSON vstupy apod.). Často se takové systémy označují jako „agendové informační systémy“.
Informace a jejich správa v takovém informačním systému je obvykle mnohem rozsáhlejší nebo naopak mnohem omezenější než u správy dokumentů v eSSL. Adaptace na požadavky na eSSL je nemožná buď bez ztráty informační a funkční hodnoty nebo bez zbytečných výdajů na doplnění bezvýznamových formálních dat, tak aby byly splněny povinné náležitosti. Každý takový systém má původce povinnost uvést ve svém spisovém řádu, aby byla existence příslušné činnosti podchycena (obdobně jako uvádění samostatných evidencí). Zároveň by měl tuto agendu zařadit do svého spisového a skartačního plánu, aby byla jasně stanovena doba uchovávání dat nebo dokumentů spravovaných tímto IS.
Příkladem takových systémů mohou být informační systémy pro správu projektů, veřejných zakázek, školské systémy, soudní systémy, systémy ve stavebnictví, informační systém evidence památek, rejstříky apod.
Veřejnoprávní původce, který spravuje informační systém, určí, že se nejedná o eSSL a pokud nebyl vydán trvalý skartační souhlas, požádá příslušný archiv o posouzení IS z hlediska správy dokumentů a výběru archiválií (posouzení IS podle § 3a).
Při výběru archiválií bude zhodnocen informační obsah systému a technické možnosti a bude zvolen nejvhodnější způsob výběru a předání archiválií. Posouzení bude provedeno v souladu s principem Archiving by Design. Při stanovení historické hodnoty a vhodnosti k trvalému uložení bude dále maximálně zohledňována snaha o agilní výběr archiválií, takže budou systémy posuzovány v kontextu ostatních systémů, aby nedocházelo k zbytečné multiplikaci dat. Pokud budou tatáž data využívána u více původců jedinečným historicky cenným způsobem, budou také vhodná k trvalému uložení.
Informace ze systému se mohou vybírat na úrovni jednotlivých klíčových entit (Archivace entit), na úrovni celého systému (data z celého systému za dané časové období – Archivace celku), příp. může být jako archiválie zvolena pouze souhrnná sestava, bez předání zdrojových dat[2] (Archivace sestav).
Při stanovení postupu výběru a posléze předávání k trvalému uložení se dále zohledňuje, zda v systému existují nebo neexistují dokumenty (objekty), zda půjde o jednorázový přenos nebo periodický přenos, zda se bude předávat inkrementálně nebo s redundantními daty apod.
Výběr archiválií provádí příslušný pečující archiv. Pokud bude zvolen postup, který neodpovídá postupu již zveřejněnému na stránkách NA, ve spolupráci s NA jej vypublikuje.
Základní předávací formou je SIP NA_IS, lze využít i SIP podle NSESSS, SIP pro geodata. Další formy mohou vzniknout ve spolupráci s příslušným archivem a Národním archivem.
Datové formáty použité pro export se řídí výstupními datovými formáty dle Formátových pravidel a metodikou NA zveřejněnou na stránkách NA.
Na základě analýzy bude stanoveno jak často a která data budou předávána. Musí se posoudit, zda lze stanovit určitou „konečnou“ událost, podle níž budou předána data, která k ní dospěla.
U často se měnících dynamických nebo dlouhodobých systémů, kde nelze vytipovat „konečnou“ událost bude někdy nutné přebírat data redundantně.
Periodicita je obvykle 1-3-5 nebo i více let, ale závisí na povinnosti původce data promazávat, proto může být někdy i častější. U stabilních systémů lze stanovit i delší dobu, ale z hlediska dlouhodobého uchovávání toto není vhodné.
Archivovat celý IS je vhodné tehdy, pokud informační hodnota spočívá v systému a jeho datech jako celku. Rovněž tehdy, kdy se jedná o unikátní data, u nichž se předpokládá budoucí využití pro datovou analýzu a další zpracování, které např. v dnešní době není realizovatelné (např. až po připojení dat, která vzniknou v budoucnu).
Součástí exportu bude vždy dodání příslušných schémat, popis dat, dodání databázových dotazů, tzv. select statements, ve struktuře SIP NA_IS.
Možné formy exportů jsou:
Jedná se o mezinárodně prověřený formát pro archivaci relačních databází SIARD.([[1]]SIARD formátová specifikace).
Nástroj pro vytvoření SIARD exportu – https://github.com/keeps/dbptk-ui/releases/tag/v2.9.1
Vytvoření datových balíčků pro jednotlivé klíčové entity, jako např. název projektu, klient, žák apod. je vhodné tehdy, kdy se jako vhodnější jeví seskupit informace, soubory, metadata vztahující se k této entitě.
Výhodou je, že lze takto přebírat samostatně uzavřené tématické entity obsahující např. velké objekty (př. filmy).
Struktura balíčku vychází ze společného balíčku SIP NA_IS.
Pokud archiv zhodnotí, že historicky cenná nejsou zdrojová data, ale pouze statistické nebo jiné datové sestavy z nich vytvořené, je vhodné dodání těchto sestav. Je ovšem nutné upozornit, že z agregovaných dat již zpětně nelze řadu údajů získat.
Nejlepší je export ve formě strukturovaných dat ve formátech CSV, XLS/XLSX, JSON nebo XML, s popisem významu dat.
Příp. lze vytvořit souhrnné sestavy v PDF/A.
Sestavy budou následně vloženy do balíčku SIP NA_IS.
SIP NA_IS vychází ze specifikace E-ARK a je možné jej k trvalému uložení předat pomocí Národního archivního portálu, v budoucnu se plánuje rozhraní pro automatizované předávání.
[1] Srv. Národní architektonický plán https://archi.gov.cz/nap:system_spravy_dokumentu?s[]=3a%2A [dostupné dne 11. 9. 2024]
[2] Za tím účelem může mezi původcem/správcem systému a příslušným archivem dojít ke společné analýze dat v systému nebo datového modelu a následnému hledání vhodné varianty v podobě datového formátu pro export množiny informací, která se má stát předmětem trvalého uložení v digitálním archivu a také případné periodicity tvorby datového exportu pro potřeby archivace.
[3] IS může mít trvalou hodnotu částečně, část může být řešena prostřednictví trvalého skartačního souhlasu
[[1]] Formát SIARD rozvinul Švýcarský federální archiv a s dalším rozvojem v rámci projektu E-ARK se stal standardem pro archivaci relačních databází v Evropě. GitHub – DILCISBoard/SIARD: SIARD (Software Independent Archiving of Relational Databases) – an open file format for the long-term archiving of relational databases