Rok 1999, č. 2, s. 71-76

Soubory autorit Národní knihovny České republiky

PhDr. Zdeněk Bartl

Národní knihovna ČR

V závěru roku 1998 vystavila Národní knihovna ČR (dále NK ČR) první početnější soubor autorit na své domovské stránce (URL: http://www.nkp.cz, oddíl katalogy a databáze/báze autorit) a počátkem tohoto roku jej zpřístupnila i prostřednictvím CD-ROM Česká národní bibliografie (kumulace za rok 1998, č.12/98). Tímto krokem bylo završeno dosavadní úsilí pracovníků oddělení národních autorit NK ČR na projektu tvorby českých souborů autorit. Domnívám se proto, že je to příležitost k obsáhlejší rekapitulaci poznatků získaných dosavadní praxí.

Obecná strategie

Jeden ze základních koncepčních bodů NK ČR pro stanovení strategického plánu tvorby souborů autorit vychází z pojetí reprezentovaného mezinárodním projektem AUTHOR (EU- COBRA+) a současnými aktivitami IFLA. Toto pojetí doporučuje používat termín soubory národních autorit pro ty soubory autorit, které budou „kopírovat“ výskyt jmen autorů, korporací atd. příslušné národní bibliografie. Znamená to, že označení národní vyjadřuje skutečnost, že forma autoritního záhlaví respektuje potřeby národních, v našem případě českých, uživatelů a také to, že záznamy autorit pro domácí jména a korporace se budou cíleně vytvářet, zatímco záznamy autorit pro zahraniční jména a korporace se budou v maximální možné míře přebírat a upravovat. Z praktického hlediska to pro naši situaci tedy znamená, že celá suma souborů jmenných autorit (označíme ji termínem české soubory autorit), bude obsahovat jmenné autority českých i jinojazyčných autorů (korporací atd.). U cizojazyčných autorů (korporací atd.) bude pozornost věnována pouze stanovení autoritní podoby záhlaví (s pomocí příslušných národních bibliografií). Větší pozornost bude věnována národním (českým) jménům (korporacím atd.). Ty budou tvořit podmnožinu českých souborů autorit a kromě stanovení autoritního záhlaví bude pozornost věnována i doplňování především informační poznámky, která stručně a výstižně charakterizuje autora a poslouží k identifikaci více autorů téhož jména. Tato podmnožina ponese označení české soubory národních autorit. Soubory jmenných autorit (names) budou využitelné samozřejmě i pro věcné zpracování a prvky v nich obsažené se objeví většinou ve stejné podobě i v souborech věcných autorit (subject). Odlišná podoba pro věcné autority bude v případě potřeby uvedena v záznamu jmenných autorit.

Evropský projekt AUTHOR

Projekt s názvem „AUTHOR“ byl realizován v letech 1995-1997 pěti národními evropskými knihovnami (belgickou, francouzskou, portugalskou, španělskou a britskou) ve spolupráci s dalšími knihovnami Evropy a Ameriky (celkem 16 knihoven ze 13 zemí). Financovala jej Evropská komise (program DG XIII). Smyslem projektu bylo praktické odzkoušení využívání („sdílení“) existujících on-line přístupných souborů autorit (v zemích participujících na projektu) pro osobní jména a korporace. Realizace projektu probíhala po jednotlivých krocích, kterými byly např. srovnání národních souborů autorit a analýza národních formátů, vypracování konverzních tabulek, konverze vzorku dat z národních formátů do formátu UNIMARC/Autority a jejich vystavení (zpřístupnění). Projekt AUTHOR potvrdil tendenci k plné kompatibilitě národních formátů s formátem UNIMARC/Autority, a dále vytváření souborů národních autorit, které by „kopírovaly“ výskyt jmen autorů, korporací atd. té které národní bibliografie. Testovací vzorky a podrobnější informace lze prohlížet na adrese URL: http://www.bl.uk/information/author.pdf

Praktické důsledky zvolené strategie

Od vydání českého překladu AACR2R probíhá v rámci pracovních skupin odborníků z různých českých knihoven při NK ČR (především pracovní skupina pro jmenné zpracování, pracovní skupina pro věcné zpracování a Rada pro katalogizační politiku; informace o dosavadní práci skupin naleznete na URL: http://www nkp.cz, rubrika odborné činnosti/katalogizace a národní bibliografie/katalogizační politika) permanentní proces českých interpretací těchto katalogizačních pravidel. V závěru prvního pololetí letošního roku by měly být vydány první výsledky tohoto snažení (aktuálně jsou interpretace schválené jednotlivými pracovními skupinami vystaveny na domovské stránce NK ČR - URL: http://www.nkp.cz, oddíl odborné činnosti/katalogizace a národní bibliografie/katalogizační politika, kde jsou v jednotlivých oddílech publikovány všechny materiály projednávané v pracovních skupinách).

Pro autoritní záznamy z těchto interpretací vyplývá několik důsledků, které v následujícím textu podrobněji probereme.

Funkce podpole f v rámci záhlaví

Z českých interpretací AACR2R vyplývá, že součástí autoritního záhlaví (pole 200 formátu UNIMARC/Autority, resp. 700 formátu UNIMARC/bibliografický) je podpole $f (roky narození, příp. úmrtí). Je-li v podpoli $f obsažen alespoň jeden prvek (rok narození nebo úmrtí), získává takový záznam autority status definitivní (k problematice statusu autority se dostaneme v další části textu). Podpole $f plní v záhlaví primárně funkci formálně rozlišovací, až sekundárně informačně-encyklopedickou. Napomáhá v rozlišení více autorů téhož jména. Stane-li se, že i rok narození (nejsou-li z nejrůznějších důvodů známa data úmrtí) je shodný, přichází na řadu jako další rozlišovací prvek celé datum narození (měsíc a den).

 

Obr.: 1 Rámečkem je zvýrazněn výskyt dvou autorů téhož jména i roku narození v bázi autorit NK ČR (zápis se zkratkou názvu měsíce není konečný, definitivní podoba zápisu zatím nebyla jednoznačně stanovena)

 Obrázek - báze autorit

Co se z věcného pohledu zdá správné a vhodné, není již tak bezproblémové z praktického hlediska sjednocování nestejně vyhlížejících záhlaví téhož autora a po určitou dobu bude knihovnám činit problémy. Autoritní záznam žijícího personálního autora, je-li označen statusem definitivního záznamu, si knihovny převezmou do svých katalogů v této podobě, avšak v okamžiku úmrtí a doplnění data úmrtí do podpole $f sice na svém statusu záznam nic nemění, změní se však množství znaků v autoritním záhlaví, a při každém dalším začleňování bibliografického záznamu právě zemřelého autora s „nově“ doplněným záhlavím do báze vznikne duplicitní výskyt tohoto záhlaví (v důsledku rozdílnosti údajů v podpoli $f). Ve svém důsledku to bude znamenat více práce pro správce souborů autorit, avšak s tím je třeba se smířit. Příklad souborů autorit (names) Library of Congress (dále jen LC), která vzhledem k používanému knihovnímu systému stále nemá „global update“ a tudíž ani nemůže dodatečně opravovat či doplňovat autoritní záhlaví (i obecně známí a dávno zemřelí spisovatelé mají v bázi autorit Names LC stále „neukončené“ údaje o úmrtí), je z našeho pohledu mnohem více škodlivější, než zvýšené nároky na správu báze autorit.

Nová pole v rámci bloku národních polí UNIMARC/Autority (pole 9XX). Přehled a jejich funkce

Dosavadní praxe v NK ČR (potvrzená i v projektu AUTHOR) ukázala, že je třeba stávající pole a podpole formátu UNIMARC/Autority rozšířit o některá další užitečná a potřebná pole/podpole. NK ČR připravila dle doporučení řešitelů projektu AUTHOR jejich návrh v rámci tzv. národních polí (s číselnou notací 9XX). Jde o dočasné řešení do té doby, než se tato navrhovaná pole/podpole stanou regulérní součástí polí/podpolí formátu UNIMARC/Autority. Výčet těchto polí/podpolí je aktuálně vystaven na adrese URL: http://www.nkp.cz, oddíl odborné činnosti/ katalogizace a národní bibliografie/ katalogizační politika/informativní materiály. Zde v tomto textu k jejich výčtu přidáváme i krátký komentář:

Pole 901 Kódované údaje pro korporace

Neopakovatelné pole.

Indikátory nejsou definovány.

 

Podpole:

a - Kód země (N)

b - Kód jazyka (N)

c - Právní forma organizace v kódované podobě (kódovník Českého statistického úřadu) (N)

d - Datum vzniku (RRRRMMDD) (N)

e - Datum zániku (RRRRMMDD) (N)

 

Pole 907 Poznámka

Podpole:

a - Text poznámky (N)

Poznámka autora: Toto pole pro biografické informace o autorovi je určeno uživatelům i katalogizátorům a k jeho návrhu jsme přikročili proto, že formát UNIMARC/Autority nenabízel vhodné pole pro informace tohoto charakteru. Pole 810b, ani 830 požadovanému účelu nevyhovují, jsou definována pro jiná uplatnění. Následující příklady názorně ilustrují použití pole 907.

 

Např.:

XY,

907$aNarozen 16.11.1905 v Líšni u Brna, zemřel 7.2.1960 v Brně. Báňský inženýr, básník, prozaik, dramatik, překlad z maďarštiny.

XY,

907$aNarozen 13.5.1899 v Chocni, zemřel 29.5.1938 ve Chvojně u Holic. Malíř, herec, publicista.

 

Vytvoření tohoto pole, resp. jeho obsah, vyvolalo mezi zpracovateli jistou polemiku. Více k obhajobě pole 907 v dalším textu.

Pole 908 Status autority

Neopakovatelné pole.

Indikátory nejsou definovány.

 

Podpole:

a - Slovní vyjádření statusu (N) Zápis: „definitivní“ nebo „prozatímní“

Poznámka autora: Status autoritního záznamu je důležitou informací pro uživatele souboru autorit a je poněkud nepřehledně ukryt na osmé pozici v poli 100 formátu UNIMARC/Autority. Proto se jevilo jako užitečné přehlednější vyčlenění do samostatného pole bloku národních polí. Definice jednotlivých úrovní statusu autority najde čtenář v manuálu UNIMARC/Autority, na str. 36 (UNIMARC/Autority : univerzální formát pro autority. - Praha : Národní knihovna, 1995).

 

Pole 909 Kód provenience autora

Neopakovatelné pole.

Indikátory nejsou definovány.

 

Podpole:

a -Kód země (N) (píše se CZ v případě autorů splňujících podmínky pro zařazení do českých národních autorit, jinak se nevyplňuje)

Poznámka autora: Má význam pro odlišení dílčí báze českých národních autorit.

 

Mezi kolegy a kolegyněmi vyvolalo vytvoření pole 907, resp. jeho naplňování obsahem (poznámkou), jistou polemiku. Nejčastějším argumentem byl poukaz na neexistenci něčeho podobného u jmenných autorit (names) LC. Ty však vznikaly v době, kdy neexistovaly žádné soubory autorit ve strojem čitelné podobě a ani náznak spolupráce v této oblasti. Technické možnosti byly silně omezené (a dosud jsou - LC stále nemá „global update“). Jedná se o nejrozsáhlejší soubory autorit na světě, postrádají však často základní údaje nezbytné k jednoznačnému rozlišení určitého autora nebo korporace. Formát UNIMARC/Autority byl naproti tomu zveřejněn až v roce 1991. Argumentace na podporu užitečnosti stručné (to třikrát podtrhujeme) biografické poznámky vychází především z jedné důležité úlohy národní bibliografické agentury, a tou je povinnost dostatečně jednoznačně identifikovat každého jednotlivého autora, aby byl odlišen od jiných téhož jména. Tento fakt potvrzuje i poznatek B. Stoklasové, která se zúčastnila rokování mezinárodní konference o národních bibliografických službách (International Conference on National Bibliographic Services) v Kodani v listopadu 1998 (viz příspěvek v tomto čísle). V diskusi byla potvrzena tendence současnosti, totiž, že úlohou národních knihoven je především tvorba a správa jmenných i věcných souborů autorit, bez jejichž existence je jakákoliv spolupráce na národní bibliografii, ale i v rámci souborných katalogů naprosto neefektivní. Faktem je, že k identifikaci slouží obsah podpole $f. Ne vždy však jsou životní data známá a prvotní zpracovatel bibliografického záznamu ne vždy v katalogizované knize najde biografické údaje identifikující autora. Tak se často stává, že zpracovatel má sice v souborech autorit k výběru několik autoritních záhlaví i s životními daty více autorů téhož jména, avšak není schopen rozhodnout, které přísluší tomu, jehož knihu právě zpracovává, jelikož nezná, nebo nemá k dispozici podrobnou bibliografii díla zpracovávaného autora a v knize žádný biografický údaj o autorovi uveden není. Zde splní svou funkci obsah pole 907.

Prvotní zpracovatel autoritního záznamu toho kterého autora zapíše informace biografického charakteru, které vyhledá v nejrůznějších přístupných pramenech (slovnících, encyklopediích, kartotékách apod.), ve stručné podobě do biografické poznámky pole 907 (formou prostého výčtu, v žádném případě by se nemělo v textu biografické poznámky vyskytovat žádné hodnotící stanovisko typu „nejvýznamnější autor..., přední představitel.... apod.). Ukázalo se jako velmi užitečné, aby tato poznámka byla vnitřně strukturovaná do několika bloků v ustáleném pořadí - informace o přesném datu (den a měsíc) a místě narození, příp. úmrtí, vyjmenování oborů působení a za třetí publikační obory konkrétního autora. Výše zmíněné doporučení nesplňují v bázi autorit NK ČR záznamy, které byly získány strukturací příruček „Kdy zemřeli“. Vzhledem k tomu, že struktura informací o zemřelých autorech byla velmi blízká dohodnuté podobě informační poznámky, probíhala strukturace záznamů z příruček zcela automaticky (skenování, OCR, tagování a bez následné editace). Tím se velmi urychlila „výroba“ autoritních záznamů formátu UNIMARC/Autority. K úpravě poznámky ve zmíněných záznamech přikročí pracovníci oddělení národních autorit časem.

Kdokoliv se potom v budoucnu znovu setká s takto zpracovaným záznamem autora, bude již mít usnadněnou práci při rozhodování, kterému autorovi, z několika možných, přiřadit konkrétní, nově zpracovávaný titul. Takovýto model zpracování národní bibliografie (snaha o maximální identifikaci autorů a přiřazení konkrétnímu původci právě a jenom jeho vlastních děl) přinese samozřejmě i užitek všem uživatelům bibliografií a knihovních katalogů. Nutno poznamenat, že je vhodné biografickou poznámku vytvářet pouze pro autory, kteří splňují hlediska českých národních autorit. U cizojazyčných autorů bude autoritativním zdrojem pro přiřazení konkrétního díla určitému autorovi příslušná národní bibliografie. Vytvářet systematicky informační aparát i pro cizojazyčné autory by nebylo reálně splnitelné.

Na častou námitku, že se stejně nepodaří vždy identifikovat nějakého autora a že bude rozlišeným heslům autoritních záznamů stejně vždy předcházet jakési „sběrné“ heslo, ve kterém se budou vyskytovat díla neidentifikovaných autorů téhož jména, např. Františků Nováků, lze jen říct, že tomu tak bezesporu bude. Avšak ani tato skutečnost nezbaví žádnou národní bibliografickou agenturu povinnosti pokusit se o maximálně možnou identifikaci autora. Ze samé podstaty věci (primární je tvorba literárních, hudebních, vědeckých atd. děl, snaha o jejich registraci, bibliografické zpracování je vždy až sekundární; zjednodušeně řečeno knihovník bude vždy o pár kroků za životem, který přináší tvorbu) vyplývá, že ideálního stavu - identifikace každé bibliografické entity - nemůže dosáhnout žádný neuzavřený katalog na světě.

Oddíl o národních polích je ještě nutné doplnit stručnou informací o rozšíření bibliografického formátu UNIMARC o podpole $s, které je možné využívat pro pole 700, 701, 702, eventuálně 200 formátu UNIMARC/Autority. Jeho použití je možné jen pro nestandardní doplňky (profesní charakteristiky) k personálním jménům (nad rámec AACR2R), sloužící k rozlišení dvou a více jinak nerozlišitelných autorů téhož jména. Používání podpole $c v polích 700-702 pro tyto účely není v žádném případě možné! (viz „Závazný výklad obsahu podpole pro zápis doplňků k personálním jménům (podpole $c, a $s)“ na domovské stránce NK ČR - URL: http//www.nkp.cz, oddíl odborné činnosti/katalogizace a národní bibliografie/katalogizační politika/informativní materiály)

 Popsanou situaci nejlépe ilustruje následující příklad:

pole 200 (event. 70-) -1 $aNovák$bJiří$spedagog

pole 200 (event. 70-) -1 $aNovák$bJiří$spsycholog

 Soubory autorit - faktografická kartotéka nebo prostředek ke sjednocení selekčních termínů?

 Z nejrůznějších rozhovorů a dotazů pracovníků našich knihoven vyplývá jeden velmi častý omyl nebo, chcete-li, nepochopení smyslu využívání a tvorby souborů autorit. Znovu a znovu se objevuje a vede k nedorozumění. Proto je třeba důrazně připomenout, že hlavním smyslem existence souborů autorit je to, že slouží jako prostředek k unifikaci selekčních prvků bibliografických záznamů. To je primární úkol souborů autorit. Jejich „encyklopedické“ využití je až sekundární. Velmi často se v dotazech pracovníci oddělení národních autorit NK ČR setkávají s pojetím souborů autorit jako báze faktografických údajů a při budování lokálních souborů autorit (na institucionální úrovni konkrétní knihovny, na úrovni regionální nebo úrovni sdružení uživatelů určitého konkrétního softwaru) nabývá vrcholu právě tento faktografický aspekt. Soustředění pozornosti při tvorbě souborů autorit na fakta není koncepčně dobré. Pozornost by měla být věnována především stanovení autoritního záhlaví a dalších nepreferovaných podob záhlaví (odkazy „viz“ a „viz též“). To pak doplnit údaji o roku narození, resp. úmrtí (podpole $f; není-li možné data zjistit, je vhodné formulovat stručně profesní charakteristiku v podpoli $s) a poté ještě doplnit heslovitě biografické údaje (pole 907 v doporučeném schématu - viz výklad výše). Neupřednostňuje-li se faktografický charakter souborů autorit před unifikačním prostředkem, pak není tak velkou chybou, používají-li všichni uživatelé souborů autorit chybné autoritní záhlaví (např. obsahuje-li záznam autority chybný údaj roku narození). Jakmile je však pojetí souborů autorit chápáno primárně z faktogra-fického pohledu, je možné donekonečna poukazovat na nedostatky v souborech autorit, protože nikdy nebudou žádné soubory na světě bez chyby. Oddělení národních autorit NK ČR tedy v žádném případě není a nikdy nebude pracovištěm encyklopedického charakteru.

Postupuje tvorba autorit rychle?

Na tuto otázku lze odpovědět jen jedním způsobem - NE. Vnucuje se tedy hned další otázka, a sice proč tomu tak je, co je příčinou nedostatečného počtu souborů národních autorit? Příčiny jsou vnitřní (v NK ČR) i vnější (neexistence kooperace a koordinace tvorby autorit).

Vnitřní příčiny

Oddělení národních autorit plní úkoly vyplývající z pracovní náplně oddělení, které jsou stanovené v Organizačním řádu Národní knihovny ČR (viz vymezení pracovní náplně oddělení národních autorit podle Organizačního řádu-http://www.nkp.cz/start/standard/organrad1.html#autor). V souvislosti s tvorbou souborů autorit plní oddělení své úkoly ve dvou rovinách. První je zajišťování obsahové správnosti a jednotnosti jmenných přístupových souborů (autoritních záhlaví) bibliografické báze NKC a jejich případné využívání pro tvorbu autoritních záznamů. Druhou rovinou je přímá tvorba autoritních záznamů ve formátu UNIMARC/Autority z interních i externích zdrojů bez přímé vazby na bibliografické záznamy báze NKC.

Přístupové soubory bibliografické báze NKC

V uplynulém období oddělení národních autorit NK ČR plnilo úkol mechanického „pročištění“ záhlaví, tj. oprava a údržba zjevných chyb v přístupových souborech (např. sjednocením podoby jména, vytvořením odkazů, doplněním údajů v polích záhlaví a v nutných případech identifikací dvou a více autorů pod jedním záhlavím báze NKC, která v současné době čítá přes 500 tisíc záznamů!) dle svých kapacitních možností. Pro čtvrtletní aktualizace ČNB odstraňují pracovníci oddělení nežádoucí duplicity v záhlaví jmen autorů báze RTR (báze retrokonvertovaných záznamů tištěných svazků ČNB - jde o projekt „Zpřístupnění záznamů české knižní produkce 20. století prostřednictvím internetu a CD-ROM“) a sjednocují je s již stanovenými autoritními záhlavími. Vedle toho se věnují doplňování chybějících údajů (zejména životních dat) u autoritních záhlaví. Ta jsou poté postupně integrována přetvořením na autoritní záznamy formátu UNIMARC/Autority do samostatné báze autorit. Nespornou výhodou „výroby“ autoritních záznamů z přístupových souborů (autoritních záhlaví) je přímá vazba na bibliografické záznamy, nevýhodou je nízká kvalita a nutnost velkého množství dodatečných prací a zjišťování. Mechanické přečištění bývá poměrně rychlé a může vést k neoprávněnému optimismu. Další fáze „výroby“ jsou již velmi pomalé a srovnáme-li rozsah přístupových souborů NK a počet lidí, který je k dispozici k jejich převedení do podoby autoritních záznamů (část pracovních kapacit musí být vázána na permanentní čištění přístupových souborů a souborů autorit), již není důvod k optimismu. Řada knihoven u nás i v zahraničí tuto cestu započala a posléze vzdala.

V tomto procesu přetvoření záhlaví ve strukturovaný autoritní záznam však dochází k odtržení záhlaví od bibliografického záznamu a tím k velkému snížení informační hodnoty takto vzniklého záznamu. Bez bližší charakteristiky je údaj o plném jménu autora s daty narození a příp. i úmrtí pro identifikaci konkrétního autora z několika možných téhož jména ve většině případů nedostatečný. Je to způsobeno omezenými možnostmi současné verze systému ALEPH, tj. neexistencí samostatné interaktivní autoritní báze. Při práci s bibliografickou bází není možné ukládat data autoritního záznamu do polí a podpolí platných pro formát UNIMARC/Autority. S využitím programátorských schopností správců systému sice byly nalezeny cesty jak ukládat některé údaje (informační poznámku o autorovi a o zdroji ověření dat), aby byly využitelné pro záznam formátu UNIMARC/Autority, vyžaduje to však následnou konverzi zapsaných údajů do formátu UNIMARC/Autority a poté včlenění autoritního záznamu do báze autorit. Zmnohonásobují se tak činnosti spojené s kontrolou na duplicitní výskyt záznamů v bázi autorit, což samozřejmě váže další pracovní čas a síly potřebné k plnění všech nutných úkolů oddělení národních autorit, řada činností musí být prováděna duplicitně.

V této souvislosti je třeba zmínit, že báze NKC ročně naroste o cca 160-170 tisíc záznamů (zpracování běžné produkce + retrokonverze), což znamená i odpovídající nárůst přístupových souborů, a tudíž je čištění přístupových souborů nutno provádět v podstatě permanentně. Při takto velkém množství dat při stávajícím počtu pracovníků oddělení národních autorit je to úkol velmi obtížný.

Obr.: 2 Následující výřez z obrazovky bibliografické báze NKC názorně ilustruje situaci po importu přibližně 30 tisíc nových záznamů retrokonverze. Výskyt jmen Karel Čapek byl před nahráním jen a pouze v souvislosti s konkrétním autorem (např. typografem, dramatikem) a bez sběrného, neidentifikovatelného (v rámečku) výskytu. Po importu figuruje v přístupovém souboru 124 (!) dokumentů "neidentifikovaného" Karla Čapka. Pro správce přístupového souboru to znamená "otevřít" jeden dokument z oněch 124 za druhým a přiřadit jej svému autorovi.

Kvantitativní růst bibliografické báze NKC z několika časově rozdílných vrstev retrokonvertovaných záznamů s sebou nese určité, a nutno říci že poměrně značné, množství chyb - duplicit, překlepů a jiných nedostatečností, které se samozřejmě projevují vznikem duplicit v přístupových souborech autorit. To klade zvýšené nároky na správu a údržbu souborů autorit. Udržet tedy v současné době se současnou verzí systému ALEPH přístupové soubory autorit (báze NKC) i soubory národních autorit (báze AUJ) bez chyb je téměř nemožné. Je nutné si uvědomit, že opravy probíhají v těchto následujících fázích.

V přístupovém rejstříku (souboru) autorit je třeba prověřit (platí obecně):

· správnost (četnost) výskytu jednotlivých položek přístupového souboru (odstranění dupli- a multiplicity)

· správnost tvaru zápisu (aby odpovídal pravidlům AACR2R a ustálenému úzu psaní např. jihoasijských jmen apod.; odstranění příp. překlepů a jiných zkomolení jména)

· sjednocení podoby jména (rozpis iniciál, pokud jsou jednoznačně zjistitelné, u ruských jmen doplnění „otčestva“ apod.)

· úplnost údajů v podpolích záhlaví (sjednocení, příp. doplnění dat narození a úmrtí, pokud jsou jednoznačně zjistitelné tak rozpis iniciál, apod.)

· vytvoření odkazů (týká se především autorů s pseudonymy, se zdvojeným jménem apod.)

· identifikace dvou a více autorů pod jedním záhlavím („rozpletení“/identifikace dvou a více autorů pod jedním záhlavím)

· úplnost a správnost údajů v polích a podpolích bibliografického záznamu (náhodně odhalené chyby)

Pro uskutečnění revize přístupových souborů je třeba rozdělit ji do dvou fází (rovin). Do první zařadit opravy zcela evidentních chyb (dupli- a multiplicita výskytu určitých položek přístupových autorit, překlepy a doplňky). Do druhé fáze oprav zařadit ostatní, méně zjevné, a proto i obtížněji odhalitelné chyby či nepřesnosti (např. identifikace autorů pod jedním mnohonásobným záhlavím), které je schopen opravit nejlépe vyškolený a zapracovaný pracovník podílející se na revizi přístupových souborů autorit. Tato fáze je také časově nejnáročnější.

Tvorba autoritních záznamů ve formátu UNIMARC/Autority

V roce 1998 se NK systematicky věnovala tvorbě a údržbě záznamů jmenných autorit nad rámec možností daných kapacitami a možnostmi financování samotné NK ČR. Bylo to umožněno přidělením grantu MK ČR (program RISK) projektu „Zpřístupnění českých národních autorit prostřednictvím internetu a CD-ROM“. Současná verze systému ALEPH však neumožňuje NK ČR vytvářet standardní záznamy autorit (podle formátu UNIMARC/Autority) a propojit je s bibliografickými záznamy. Práce proto musely probíhat paralelně (a často duplicitně) ve speciální bázi nadefinované pro záznamy jmenných autorit (AUJ) a v přístupových souborech k hlavní bibliografické bázi NK ČR (NKC). V technicky velmi složitých podmínkách se podařilo vytvořit základ jmenných autorit pro personální autory ze dvou hlavních zdrojů - úpravou a doplněním přístupových souborů/záhlaví k bázi NKC a převodem externích zdrojů do formátu UNIMARC/Autority (Kuncova kartotéka a publikace „Kdy zemřeli“). Proběhly přípravné práce pro tvorbu záznamů jmenných autorit pro korporace (báze institucí Českého statistického úřadu).

Po dokončení všech přípravných prací (tagování, konverze a export do systému ALEPH) byl na podzim loňského roku proveden export celé Kuncovy kartotéky do báze AUJ. Poté také export „vypreparovaných“ autoritních záhlaví ze záznamů autoritní báze AUJ do bibliografické báze NKC. Od tohoto okamžiku nastalo dlouhé období odstraňování duplicit vzniklých:

· již v Kuncově kartotéce - jednoho a téhož autora zařadil Kunc pod různé varianty jména, aniž je propojil odkazem

· doplňováním a opravou autoritních záhlaví v NKC dříve, než byl naexportován Kuncův soubor do NKC

· automatickým spojením dvou a více jmen stejně znějících z odkazů a autoritních záhlaví pod jedno záhlaví

· rozdílnou podobou informační poznámky z NKC (připravenou při nutnosti rozlišení dvou a více autorů téhož jména) a z Kuncových záznamů

· v neposlední řadě způsobených objektivně neschopností odhadnout chování systému ALEPH při přenášení záznamů/záhlaví z jedné báze do druhé a naopak.

Z uvedených analýz je zřejmé, že většina kapacity oddělení národních autorit je v současné době věnována údržbě přístupových souborů báze NKC. Do báze AUJ jsou nově ukládány záznamy o autorech zjištěné při zpracování souběžné produkce. Pouze malá část kapacity je v současné době věnována převodu externích zdrojů do báze AUJ.

Tento stav není možné považovat za dobrý. Jelikož výše uvedené činnosti vyčerpávají plně kapacitu oddělení národních autorit, musely být zcela potlačeny koncepční činnost a cílená tvorba záznamů autorit pro určité frekventované skupiny autorů nebo korporací. Jejich obnovení předpokládá další stupeň racionalizace činností souvisejících s přístupovými soubory jak v NK ČR, tak i v dalších knihovnách.

„Bez (spolu)práce nejsou koláče/autority“ (Vnější příčiny)

Je až s podivem, že se mezi našimi knihovníky a knihovnicemi neustále ozývají hlasy volající po regulérních souborech autorit a přitom (s výjimkou sdružení uživatelů systému LANius) se nikdo, i přes četné výzvy ke spolupráci a koordinaci při tvorbě souborů autorit, ke společnému postupu nehlásí, ačkoliv se čile vydávají nejrůznější soupisy regionálních osobností, spisovatelů apod. Strukturací těchto zdrojů do formátu UNIMARC/Autority by vznikly celkem kvalitní autoritní záznamy pro osobnosti, které v dostupných slovnících a encyklopediích často nejsou uvedeny. A to je škoda. Zpřístupněním v bázi národních autorit by si knihovny mohly navzájem pomoci ke zkvalitnění svých vlastních souborů autorit

Závěrem

 Národní knihovna bude i nadále zdarma aktuálně zveřejňovat dokončené autoritní záznamy. K dosavadním způsobům zveřejnění (CD-ROM Česká národní bibliografie a prostřednictvím internetu http://omega.nkp.cz:4001/Aleph/cze/nkc/cla/cla/start ) přibude v dohledné době i zveřejnění na FTP serveru NK ČR, což přinese uživatelům výhodu zisku dat i s českou diakritikou (při stahování záznamů z webovské adresy pomocí e-mailu tato „maličkost“ bohužel chybí).

Případným zájemcům z řad knihoven o spolupráci při tvorbě souborů autorit zůstávají dveře v NK ČR i nadále otevřeny.