6.1.5. Dědičnost prvků popisu
Základní pravidla pro zpracování archiválií (ZP) určují požadavky na víceúrovňový archivní popis a pravidla jeho tvorby. Hierarchický popis archiválií vychází z hlavních principů: popis od obecného ke konkrétnímu, popis informací na odpovídající úrovni popisu a neopakování informací (viz ISAD(G) a ZP). Tyto principy vedou k tomu, že tytéž prvky popisu mohou být uváděny na různých úrovních popisu a nejpozději v okamžiku prezentace archivního popisu badatelům obecně dochází k jejich přenosu na nižší úrovně.
V aplikacích pro popis archiválií jsou informace stanovené pravidly (hodnoty daného prvku popisu) uváděny na různých úrovních dané větve popisu, ale způsob jejich interpretace ve vztahu k vyšším a nižším úrovním je rozdílný a nelze jej zjednodušit na univerzální dědění hodnot všech prvků popisu. Archivní popis je primárně předáván v datovém souboru formátu EAD, případně v podobě jiných výměnných datových formátů.
Kapitola poskytuje přehled implementace dědičnosti v aplikaci ELZA, včetně odkazu na konkrétní metodická a technická řešení indexace, vyhledávání a zobrazování informací v souvisejících aplikacích a informačních systémech.
Východiskem je dokument, který byl připraven letech 2023–2024 v rámci jednání komunity ELZA a připomínkován zástupci jiných archivů, kde jsou rovněž implementována Základní pravidla pro zpracování archiválií (uživateli aplikace ProArchiv).
1. Vymezení pojmů
dědění [1] (dolů) – přenos informace (uplatnění hodnoty prvku popisu) z vyšší úrovně popisu na nižší prostřednictvím vizualizace nebo indexování (viz níže)
agregace (nahoru) – získání informací z nižších úrovní jejich projitím a sjednocením, např. datace větve archivního popisu zjištěná z datací jednotlivých nižších jednotek popisu
vizualizace – způsob uplatnění (dědění) hodnot prvků popisu při tvorbě archivního popisu nebo jeho publikaci, kdy jsou na nižších úrovních zobrazovány také hodnoty z vyšších úrovní
indexování – technický proces a způsob ukládání informací za účelem budoucího efektivního vyhledávání, typicky má podobu tzv. invertovaného indexu; jen dle informací uložených v indexu je možné položku najít
2. Metody zápisu a interpretace prvků popisu
Výše uvedené oblasti a typy problémů dopadají různým způsobem na prvky popisu podle toho, zda se jedná o popisné (textové) prvky různé stylistické podoby, nebo pevné kategorie (jazyk, původce, role entit, jiné označení), a dále v závislosti na opakovatelnosti prvku popisu. Odlišení jednotlivých způsobů přenosu informace mezi úrovněmi hierarchického popisu umožní v dané situaci určit odpovídající způsob zápisu hodnoty prvku a její následné interpretace. Optimálním stavem je stanovení základních kategorií s přiřazením jednotlivých prvků popisu. V některých situacích je nutné zvážit také typ úrovně popisu a případně další kontext prvku v rámci jednotky popisu.
2.1. Doplňování a rozšiřování
Hodnota prvku popisu na nižší úrovni doplňuje a rozšiřuje hodnotu uvedenou na vyšší úrovni popisu a významově ji plně nenahrazuje. Hodnota uvedená na nižší úrovni by bez hodnoty uvedené na vyšší úrovni nemusela být správně interpretována. [2] Hodnoty z vyšších úrovní se dědí (uplatňují) na nižších úrovních, a to v závislosti na prvku popisu nebo úrovni popisu.
Prvky popisu: Obsah, regest, Omezení přístupnosti (rozsah)
2.2. Přetěžování a specializace
Hodnota prvku popisu uvedená na nižší úrovni popisu je přesnější a plně nahrazuje hodnotu uvedenou na vyšší úrovni popisu. Hodnoty se dědí (uplatní) na nižších úrovních popisu, pokud není prvek (nebo jeho specifikace) znovu nastaven.
Prvky popisu: Datace vzniku, Jazyk, Ukládací jednotka, Existence kopií JP, Role entit, Původce, Autorské dílo, Omezení přístupnosti (příznak Zveřejněno)
2.3. Hodnota vázaná na úroveň
Hodnota prvku popisu má význam jen v místě jejího uvedení a nedochází k přenosu na nižší úroveň. Hodnoty z vyšších úrovní nejsou děděny (uplatněny) na nižších úrovních popisu v plném významu. Při využívání archivního popisu se předpokládá přiměřená míra interpretace hodnot z vyšších úrovní na straně badatele. V některých konkrétních případech je vhodné hodnoty indexovat na nižších úrovních popisu.
Prvky popisu: Úroveň popisu, Referenční označení, Pořadové číslo, Inventární číslo, Jiná označení, Kvantita, Množství (kusů, listů, stran, byte) [3], Typ archiválie [4], Počet archiválií [5], Přímý zdroj akvizice, Budoucí přírůstky, Měřítko, Formální název jednotky popisu
2.4. Neurčité či nelze rozhodnout
U všech prvků popisu dle ZP není v tuto chvíli nutné a vhodné pevně stanovit jejich význam z hlediska hierarchického popisu. Důvodem je nižší významnost prvku pro badatele a jejich časté uvádění z evidenčních důvodů. Je možné, že hodnota má význam pro nižší úrovně popisu, ale metodická shoda by byla obtížná či složitě kontrolovatelná a vymahatelná. Na prvky se proto nahlíží shodně jako v případě hodnot vázaných na úroveň popisu a hodnoty z vyšších úrovní nejsou děděny (uplatněny) na nižších úrovních popisu.
Prvky popisu: Zpracovatel jednotky popisu, Dějiny jednotky popisu, Způsob uspořádání jednotky popisu, …
3. Prvky popisu
U vybraných prvků popisu je možné podrobněji stanovit jejich metodu zápisu a interpretace. Pokud prvek není blíže definován, spadá do kategorie Neurčité či nelze rozhodnout.
3.1. Označení jednotky popisu
Prvky popisu určující označení jednotky popisu jsou vždy pevně vázány na danou úroveň popisu.
Prvky popisu: Referenční označení, Pořadové číslo, Inventární číslo, Jiná označení
Interpretace: Hodnota vázaná na úroveň
Důsledek: Uvedení (neplatné) signatury z vyšší úrovně a části regestu z nižší úrovně neumožňuje dohledání jednotky popisu z nižší úrovně. V odůvodněných případech je přesto možné v konkrétním systému indexovat hodnoty vybraných prvků popisu na nižší úrovni (např. inventární číslo, signatura).
3.2. Obsah, regest
Prvek popisu Obsah, regest se vždy rozšiřuje a doplňuje. Pokud prvek popisu na dané úrovni není uveden, přebírá se pro účely prezentace hodnota prvku z bezprostřední vyšší úrovně, kde je uvedena. Pro účely indexace se na nižší úrovni indexují hodnoty ze všech vyšších úrovní.
Interpretace: Doplňování a rozšiřování
Důsledek: Uvedení části informace na vyšší úrovni a části na nižší úrovni přesto umožňuje dohledat jednotku popisu.
Příklad:
složka: projekty těžby uhlí
jednotlivost: štola Dukla III
Při hledání výrazu: „uhlí Dukla“ by měla být nalezena příslušná jednotlivost.
3.3. Datace jednotky popisu
Datace vzniku jednotky popisu uvedená na dané úrovni popisu je vždy novou a absolutně platnou hodnotou. Hodnota datace z vyšší úrovně se použije v případě neuvedení datace na dané úrovni a její dostupnosti výše.
Interpretace: Přetěžování a specializace
Pokud datace není uvedena na mezilehlých úrovních, tak je přebírána z vyšších úrovní. Pokud není na vyšší úrovni k dispozici, tak je použita agregace z nižších úrovní.
Prvek popisu Textový způsob zápisu datace slouží k slovnímu vyjádření, zpřesnění nebo zaznamenání jiné původní formy datace vzniku jednotky popisu (např. zápis hiátů, datace dle jiného kalendáře) a je vždy významově spojen s prvkem Datace vzniku JP. Uvedení prvku Datace vzniku JP na nižší úrovni plně nahrazuje také hodnotu prvku Textový způsob zápisu datace.
Interpretace: Přetěžování a specializace
Důsledek: Upřesnění datace vzniku JP na jednotlivosti (např. 1810) plně nahrazuje nejen hodnotu datace vzniku JP (1808–1908), ale i případný textový zápis datace (např. 1808, 1810, 1908), uvedené na nadřazené složce.
Prvek popisu Jiné datace je považován za prvek popisu upřesňující pouze význam dané úrovně popisu a nedochází k jeho přenosu na nižší úrovně.
Interpretace: Hodnota vázaná na úroveň
3.4. Tematický popis jednotky popisu
Prvek popisu je v českém prostředí tradičně součástí úvodu archivní pomůcky a postupně je využíván i na nižších úrovních popisu. Prvek popisu poskytuje prostor pro podrobnější popis archiválie, který by nezahlcoval prvek Obsah, regest [6], ale v praxi nadále převažuje tradiční užití.
Interpretace: Hodnota vázaná na úroveň
Za účelem indexace může být výběrově a předem definovaným způsobem spojován s prvkem Obsah, regest (např. na úrovni složka a níže).
Důsledek: Souhrnné údaje uváděné zpravidla na úrovni série a výše za účelem jejich agregace do úvodu archivní pomůcky (viz níže příklad bitva u Lipska, bitva u Waterloo) nebudou vyhledány na nižších úrovních.
3.5. Formální název jednotky popisu
Formální název jednotky popisu se používá pro zápis původních názvů dokumentů nebo názvů autorských děl. Hodnota je tedy z principu vztažena k dané jednotce popisu a není přenášena na nižší úrovně.
Interpretace: Hodnota vázaná na úroveň
Důsledek: Pokud není na vyšší úrovni vyplněn prvek Obsah, regest, ale je zastoupen hodnotou Formální název jednotky popisu, podřízená jednotka popisu nebude vyhledána.
3.6. Ukládací jednotka
Interpretace: Přetěžování a specializace
Uplatnění PP Ukládací jednotka na nižších úrovních je předpokladem pro objednávání archiválií v analogové podobě prostřednictvím digitální badatelny.
3.7. Existence kopií jednotky popisu
Interpretace: Přetěžování a specializace
3.8. Jazyk
Jazyk archiválií je hodnota vybraná z číselníku. Na vyšších úrovních je možné určit majoritní jazyk. Na nižších úrovních je možné popsat konkrétní jazyk, kterým jsou archiválie zaznamenány.
Interpretace: Přetěžování a specializace
Příklad: pokud je většina archiválií psána česky, určí se toto na kořeni AS. U konkrétní archiválie je možné určit, že je psána francouzsky, popřípadě francouzsky a česky.
Nově připravovaný prvek „Jazyk archivního souboru“ [7] bude možné použít jen na kořeni AS a bude svým významem omezen jen na tuto úroveň.
Interpretace: Hodnota vázaná na úroveň
3.9. Rozměry, hmotnost, velikost, množství
Prvek ZP 5.2.4 Rozměry, hmotnost, velikost, množství je v aplikacích pro zpracování archiválií zastoupen větším počtem prvků popisu různé kvality. Předpokládá se popis na úrovni konkrétní archiválie (nejčastěji jednotlivosti), ačkoli v některých situacích by mohla být z pohledu uživatele výhodnější editace společných hodnot u nadřazených složek (např. standardizovaný rozměr fotografií). Popis hodnot těchto prvků v aplikacích usnadňují funkcionality hromadných úprav (v aplikaci ELZA nástroje Tabulkového zobrazení). Při využívání archivního popisu lze běžně očekávat vyhledávání archiválií dle rozměrů (např. fotografií), na rozdíl od množství. Hodnoty prvků by měly být zpravidla uváděny na dané úrovni bez dědění na nižší úrovně.
Prvky: Kvantita, Množství, Výška, Šířka, Hloubka, Hmotnost, Jiné rozměry
Interpretace: Hodnota vázaná na úroveň
3.10. Měřítko
Měřítko je textový prvek, který se uvádí výhradně u map, atlasů a technických výkresů. Předpokládá se popis na úrovni jednotlivost, proto nevzniká častá potřeba přenášení hodnot na nižší úrovně.
Interpretace: Hodnota vázaná na úroveň
Důsledek: Pokud je část mapy (okénko) zhotovena v jiném měřítku, je třeba hodnotu uvést na úrovni část jednotlivosti.
3.11. Původce
Interpretace: Přetěžování a specializace
3.12. Role entit
Prvek popisu role entit je velmi rozmanitý. Zahrnuje role entit, které se vztahují jen k dané archiválii nebo jsou použity jako společné na vyšší úrovni, např. pro vymezení tématu formou odkazu na obecný pojem. V některých situacích se může jevit jako vhodnější cesta doplňování a rozšiřování (obecné pojmy), ale komplexnějším a technicky jednodušším řešením je metoda přetěžování a specializace. Forma interpretace prvku je dána kombinací vizualizace a případného potlačení děděných hodnot, a přidáním nových hodnot odpovídajících dané úrovni.
Interpretace: Přetěžování a specializace
Důsledek: Pokud na vyšší úrovni popisuji autora textu archiválie a na nižší úrovni chci věcně pouze doplnit dalšího spoluautora, je nutné zde také mít připojeny všechny další relevantní entity vyskytující se v dané roli na vyšších úrovních. Konkrétní technické řešení může tuto činnost usnadnit.
3.13. Omezení přístupnosti
U prvků pro omezení přístupnosti je nutné rozlišovat mezi textovými prvky (ZP 4.4.1, 4.4.2 a 4.4.3) a jejich strojově čitelnými ekvivalenty (v aplikaci ELZA se jedná o prvky Druh omezení přístupnosti a Zvláštní omezení přístupnosti).
U textových prvků se nepředpokládá využití pro vyhledávání nebo automatickou interpretaci na úrovni prezentace.
Interpretace: Hodnota vázaná na úroveň
Strojově čitelné prvky naopak samy o sobě slouží pro automatickou interpretaci, respektive správné vyhodnocení omezení přístupnosti pomocí filtrů. Hodnotou těchto prvků je vždy konkrétní rozsah omezení přístupnosti, včetně znepřístupnění celé jednotky popisu a všech podřízených úrovní, které je absolutní. Hodnoty těchto rozsahů se dědí na nižší úrovně popisu. Přetěžování pozitivní hodnotou, která ruší veškerá omezení, je možné zvláštním prvkem popisu (v aplikaci ELZA se jedná o prvek Zveřejněno), s výjimkou zcela znepřístupněné části větve archivního popisu.
Interpretace:
Doplňování a rozšiřování (rozsah omezení přístupnosti)
Přetěžování a specializace (příznak: Zveřejněno)
Důsledek: S principem dědičnosti je třeba počítat například při volbě mezi rozsahy použití prvků s omezením a nepřístupný prvek obsah, při jehož použití dochází k znepřístupnění prvku Obsah, regest u všech (podřízených) jednotek popisu, kde není editován variantní prvek Obsah s omezením přístupnosti. V některých situacích je vhodnější nastavení rozsahu použití prvků s omezením, kdy není nutné nezávadné hodnoty prvku Obsah, regest přesouvat na nižších úrovních do prvku Obsah s omezením přístupnosti.
4. Dopady do Elza
4.1. Vizualizace děděných hodnot
UI je doplněno o způsob zobrazení hodnoty převzaté z vyšší úrovně, která nebyla přímo uvedena na aktuálně zobrazené jednotce popisu.
Potřeba vizualizace děděných hodnot je relevantní u níže uvedených prvků popisu:
Poznámka
U prvku Původce dochází k zobrazení děděné hodnoty pouze v případě nového přidání prvku (hodnota se zpravidla uvádí na kořeni AS nebo vyšších sériích).
4.2. Uložení hodnot s přetěžováním
Děděné hodnoty je možné na nižší úrovni potlačit, nebo opětovně povolit.
Převzaté hodnoty (potlačené nebo povolené) obsahují odkazy na prvky popisu z vyšší úrovně, které jsou jejich zdrojem.
Potřeba aktivního potlačení děděných hodnot je relevantní u níže uvedených prvků popisu:
Varování
U výše uvedených prvků popisu je při změně hodnoty na vyšší úrovni třeba počítat s dopadem na jednotky popisu na nižších úrovních, kde mohou být dané hodnoty potlačeny nebo povoleny.
U následujících prvků popisu není umožněno potlačování děděných hodnot, protože metoda přetěžování a specializace je řešena jinými způsoby (např. zpřesněním hodnoty datace, která musí být zahrnuta do hodnoty vyšší úrovně).
4.3. PP Jazyk archivního souboru
Popis je doplněn o nový prvek Jazyk archivního souboru, který je povinný na úrovni archivní soubor. Součástí implementace je migrace dosavadních dat kořenového prvku Jazyk na nový prvek Jazyk archivního souboru.
4.4. PP Obsah, regest s omezením přístupnosti
Prvek popisu Obsah s omezením přístupnosti se chová z hlediska dědičnosti shodně s prvkem popisu Obsah, regest.
5. Dopady do EAD
Způsob interpretace hodnot prvků popisu ve výměnném formátu EAD je za účelem dosažení jednotného a jednoznačného výkladu dat popsán v Dokumentaci EAD.
6. Dopady do Aron
Způsob interpretace hodnot prvků popisu v publikačním software ArchivOnline (ARON) odpovídá potřebám a podmínkám konkrétního nasazení v daném archivu. Společná metodická a technická řešení indexace, vyhledávání a zobrazování informací jsou popsána v Dokumentaci ARON.