Rok 1999, č. 3, s. 105–109

Memoriae Mundi Series Bohemica - DIGITÁLNÍ ZPŘÍSTUPNĚNÍ VZÁCNÝCH DOKUMENTŮ

Adolf Knoll

Národní knihovna ČR

Memoriae Mundi Series Bohemica je program digitálního zpřístupnění vzácných dokumentů z fondů českých knihoven, archivů, muzeí a z majetku dalších institucí ne-bo jednotlivců. Memoriae Mundi Series Bohemica se hlá-sí k programu UNESCO Paměť světa (Memory of the World), pro který jsme zpracovali již několik pilotních výstupů, v nedávné době dokonce datový formát DOBM, který byl přijat jako mezinárodní standard UNESCO pro digitální publikace Paměti světa. Program je ve světě již delší dobu velmi dobře známý a uznávaný, a to nejen v kruzích blízkých UNESCO, ale i v Evropské komisi a dalších institucích. Jak již to někdy bývá, v ČR bylo jeho vstupování do povědomí kulturních institucí poněkud obtížnější, i když i zde dochází v poslední době k pozitivním změnám. Program je například výslovně citován v dů-vodové zprávě ke Strategii účinnější státní podpory kultury (tzv. kulturní politice), kterou schválila vláda ČR a kde se hovoří o podpoře financování programu centrálně v Národní knihovně České republiky (NK ČR).

Memoriae Mundi Series Bohemica souvisí s rozvojem digitalizace a souvisejících činností v NK ČR. Je výsledkem dlouhodobé a systematické spolupráce s firmou Albertina icome Praha.

Základní momenty rozvoje programu digitalizace v Národní knihovně ČR

1992

• podepsána smlouva s UNESCO o přípravě a vydání úvodního CD-ROM programu Paměť světa

1993

• v dubnu u nás vychází CD-ROM Paměť světa, vůbec první CD-ROM v rámci programu UNESCO

1994

• hledány cesty co nejefektivnějšího pořizování digitálního obrazu, testy digitálních kamer

1995

• na CD-ROM vydány dva úplné rukopisy, čímž je oficiálně zahájen projekt Memoriae Mundi Series Bohemica pod hlavičkou programu Paměť světa

1996

• v Praze zasedá Subkomise pro technologii a zahájeny jsou práce na strukturaci digitálního dokumentu

• zprovozněno vlastní digitalizační pracoviště v NK ČR

• poprvé navrženy a aplikovány otevřené struktury digitálního dokumentu

• zahájena rutinní digitalizace rukopisů v NK ČR

• v NK ČR uspořádáno školení UNESCO na téma digitalizace rukopisů pro odborníky z několika zemí střední a východní Evropy

1997-1998

• získán grant z oblasti výzkumu a vývoje na léta 1997-1998

• zlepšeno technologické zázemí

• založen digitální archiv

• vzniká databáze archivu na internetu a ověřovány jsou možnosti zpřístupnění rukopisů po internetu

• v prosinci 1997 publikován formát DOBM (rozšířená forma HTML), další předpisy a programové nástroje na CD-ROM

• digitalizovány ohrožené zvukové nahrávky

• speciální projekty: vydán Katalog arabských rukopisů NK ČR, zpracovává se pozůstalost Vratislava Effenbergera obsahující významné dokumenty českého surrealismu

1999

• vychází CD-ROM Digitization of Rare Library Materials: Storage and Access to Data, jež je definitivním vydáním standardu DOBM

• standard DOBM je v lednu 1999 na zasedání v Madridu přijat Subkomisí pro technologii jako standard UNESCO pro publikace Paměti světa; v červnu je toto rozhodnutí potvrzeno na zasedání Mezinárodní poradní komise Paměti světa ve Vídni

• digitalizace se rozšiřuje na práce i pro jiné knihovny a archivy; Československá obchodní banka po úspěchu Katalogu arabských rukopisů na CD-ROM sponzoruje práce na obdobném katalogu perských rukopisů

• výzkum a vývoj v této oblasti má charakter udržování standardu a testování dalších formátů

S informacemi o projektu Memoriae Mundi Series Bohemica se lze setkat nejen na internetových stránkách, ale i v tisku a na řadě mezinárodních konferencí. Náš program na sebe upozornil také mimo program UNESCO Paměť světa a vešel v obecnou známost ve světovém měřítku. Je přítomen v nejnovějších průzkumech digitalizace zpracovaných jak Evropskou komisí, tak i v této chvíli společně silami UNESCO a IFLA.

Východiska našeho řešení

V rámci programu Paměť světa bylo v prvních letech jeho existence publikováno v různých zemích hned několik CD-ROM majících vztah k historickým fondům. Mezi nejzajímavější z nich patří edice týkající se arabských rukopisů ze San’á, nově objevených v roce 1972 a řadících se mezi nejvýznamnější památky arabské kultury, a CD-ROM s astronomickými rukopisy z observatoře v Kandilli (Turecko). Z poslední doby pak stojí za pozornost digitální vydání afrických pohlednic.

Přestože jde ve všech třech případech o nesmírně zajímavý materiál, hrozí těmto i dalším edicím nebezpečí, že veškeré úsilí vynaložené při jejich vzniku přijde jednoho dne vniveč, protože jak obrazová, tak doprovodná textová data jsou svojí strukturací dosti těsně svázána s tím kterým konkrétním programovým řešením, což může v budoucnu, až zanikne daný software nebo celá obecná softwarová platforma, bud’ zcela znemožnit nebo přinejmenším značně zkomplikovat jejich čitelnost.

Je samozřejmé, že dokonalé zpřístupnění dat je možné pouze v jedné určité aplikaci, přizpůsobené potřebám čtenáře. Taková aplikace se bude vždy vázat na konkrétní programové produkty, avšak neměla by být rozhodně jediným klíčem otevírajícím přístup k datům. Pořízená data by naopak měla být obecně dostupná a čitelná. Jak s nimi bude později nakládáno, nechť je doménou příslušného uživatelsky zaměřeného softwaru.

Naším cílem není vytvářet nové dokumenty o dokumentech. Chceme však pro velkou většinu badatelů zajímajících se o dokument z obsahového hlediska nabídnout zprostředkovaný pohled na originál s využitím moderní techniky a vytvořit cesty, jak zpřístupnit samotné informace o existenci těchto dokumentů.

Základní vlastnosti digitálního dokumentu

Digitální data proto musí být vyjádřena a strukturována tak, aby bylo možné se k nim dostat i běžně dostupnými prostředky: musí využívat co nejrozšířenějších standardů a i složité vztahy mezi nimi a komentáře k nim je třeba vyjádřit co nejčitelnějším způsobem. Velice zjednodušeně by se dalo říci, že popisná data a soubory řídící přístupnost dat musejí být založeny na jednoduchém textu bez diakritiky - textu v kódu ASCII (American Standard Code for Information Interchange), který je jedním ze základních počítačových pojmů. K propojení jednotlivých částí tohoto textu a jeho skloubení s vnějšími daty (například s vyobrazenou stránkou rukopisu) byl pak jako nejvhodnější vybrán jednoduchý a počítačově běžně čitelný jazyk SGML (Standard Generalized Markup Language).

Objekty v digitálním dokumentu

V našem pojetí chápeme jakýkoli dokument (a nezáleží na tom, zda jde o krátkou poznámku na kousku papíru nebo mnohasetstránkový spis či multimediální publikaci) jako soubor různých objektů, z nichž můžeme vybudovat libovolnou dokumentovou strukturu. Je to stejné, jako když se z cihel, oken, dveří či střešních tašek staví dům.

Ke stavbě domu můžeme použít cihly jednoho či více druhů, tvarů a velikostí. A přestože se například cihla šamotová od cihly pálené dost liší, obě označujeme výrazem „cihla“. Pojem „cihla“ tu vlastně představuje určitou kategorii - minimum společných kritérií, která musejí všechny cihly splňovat. Aby mohl být určitý předmět označen jako cihla, musí sloužit jako stavební materiál, být vyroben člověkem, nepropouštět vodu, být pevný atd. Barvou, tvarem a velikostí se však jednotlivé druhy cihel mohou lišit. Stejně tak může popisný objekt (jako pevně pojmenovaný soubor určitých vlastností) v daném dokumentu nabývat hned několika podob.

V případě rukopisu NK ČR Codex Pictoricus Mexicanus s mnoha obrázky živočichů je velmi užitečné zvolit si za jeden z popisných objektů kategorii „živočich“, přičemž jednou se uvedená kategorie v rámci tohoto rukopisu nebo jeho digitální kopie projeví jako leguán, podruhé jako nějaký pták, potřetí jako nějaký druh hmyzu. Podobně i základní stavební objekt rukopisu - stránka nebo list (folio) - bude pokaždé jiný.

Je logické, že objekty jako „stránka“, „autor“ knihy nebo její „název“ jsou svým dlouhým užíváním již dobře definovány, zatímco jiné je vhodné vytvořit jako nové objekty. Jejich sledování v dokumentu, případně celé skupině dokumentů, může přinést cennou výpověď o celém kulturním pozadí doby a místa vzniku památky, a zasloužit se tak o odhalení nových souvislostí.

SGML podporuje práci s objekty

Definovat objekty, označovat jejich výskyt uvnitř dokumentu a postihnout vzájemné vztahy mezi objekty uvnitř dokumentu i mimo něj dokáže již zmíněný jazyk SGML. S jeho pomocí lze vytvořit určitý základní nosný skelet, který se stane oporou pro jeden či více dokumentů a napomůže zároveň přístupu k jejich jednotlivým sdělením (v digitálním světě například k obrazovým kopiím jednotlivých stran rukopisu). Tento základní skelet je při dodržení principů SGML vždy čitelný jako jednoduchý text, s jehož pomocí lze zmapovat celý dokument a vyjádřit jeho strukturu. I když jsou k pohodlnému čtení tohoto textu nutné speciální programy, je jeho obecná čitelnost předpokladem pro budoucí zprostředkování daného dokumentu s využitím libovolného softwaru a hardwaru, který, jak doufáme, bude vždy schopen zpřístupnit jednoduchý text.

Námi vytvořená digitální kopie a všechny komentáře k ní pak mohou být uchopeny v jakémkoli prostředí, kde pro ně vznikne programová aplikace schopná plně využít námi pořízená data, a to i v době, kdy třeba již dávno nebudou existovat pro nás běžné platformy PC či Mac, o dnes tolik rozšířených operačních systémech, jakými jsou Mac, Windows, DOS nebo Unix ani nemluvě.

Velkou péči je ovšem nezbytné věnovat i netextovým datům, v našem případě obrazovým a zvukovým, včetně dat digitálního videa. O jejich dlouhodobou čitelnost musí být postaráno v digitálním archivu. Tato data se dnes ukládají v různě rozšířených a standardizovaných formátech, které mají jedno společné: jednoho dne se prostě mohou přestat používat.

Použití nejrozšířenějších datových formátů přesto poskytuje jistou záruku; vzhledem k tomu, že je s jejich pomocí uloženo značné množství dat po celém světě, dá se předpokládat, že bude z ryze ekonomických důvodů v této oblasti docházet jen k pomalým změnám. Jelikož budou v budoucnu rozvíjeny pravděpodobně formáty v současnosti nejvíce používané, zpětná konvertibilita u nich bude zajištěna spíše než u formátů málo rozšířených.

Jak využít těchto principů?

Jelikož si uvědomujeme, jak výraznou roli v současném globalizujícím se světě sehrává internet, snažíme se v našich doporučeních i naší práci upřednostnit právě prvky umožňující internetovou komunikaci: jde zejména o platformu HTML (Hypertext Markup Language), představující jeden ze základních komunikačních standardů sítě WWW (World Wide Web), stejně jako o používání obrazových formátů celosvětově užívaných v této síti (JPEG, GIF).

Samozřejmě, že platformu HTML, která je konkrétní aplikací jazyka SGML, bylo třeba v rámci tohoto jazyka - formou aplikace pracovně nazvané DOBM - rozšířit, aby plně vyhovovala popisu nezbytné objektově orientované struktury. HTML je totiž jednoduchý jazyk, založený na poměrně malém omezeném počtu objektů, které určují vzhled dokumentu při zobrazení. Další objekty tato aplikace bohužel definovat neumožňuje. HTML jako běžný textový editor dokáže předepsat, kde má být nový odstavec, kde nadpis, co bude zobrazeno tučně nebo kurzívou, případně zařídit, aby se společně s výsledným dokumentem zobrazil další soubor (například obrázek). Sám o sobě však například neumí označit, co je iluminace nebo která část textu představuje popis rostliny. Toto právě řeší používané rozšíření HTML nebo lépe řečeno náš nový formát DOBM, který využívá základních formátovacích vlastností HTML.

Podstata řešení

Základními východisky našeho řešení jsou zohlednění internetového prostředí WWW (neboli sítě sítí) a naše pojetí smyslu digitalizace rukopisů a starých tisků.

Náš program se nesnaží nahradit originální dokumenty, spíše chce zprostředkovat jejich dostupnost. To nám umožňuje, abychom sami určili parametry použitého grafického datového formátu. Tím, že originál nechceme nahradit, můžeme zároveň pro archivní uchování volit určitý způsob a stupeň komprese dat, která se navíc odehrává v oblasti mimo možnosti vnímání lidského oka.

Náš program se snaží vyhnout snaze po extrémním rozlišení, které sice může znamenat nepatrný růst praktické a dlouhodobé hodnoty, zato však obvykle znamená podstatný růst nákladů, a při daném množství finančních prostředků tedy i menší počet zpřístupněných dokumentů. Na druhé straně je však nutné určitou vhodnou kvalitu zachovat a zbytečně se nepodřizovat současným nebo lokálním technickým možnostem.

Námi vytvořený konkrétní digitální dokument je archivován. Uchovat přitom můžeme jen informace navozující iluzi originálu, přičemž míra věrnosti originálu není přesně změřitelná. Archivujeme-li tedy dokument, který jsme se rozhodli vytvořit, nevylučujeme zároveň užití jiných grafických formátů (z nichž nejspíše připadá v úvahu TIFF s jakýmikoli parametry, případně PNG), nebo užití jiného způsobu komprese dat, odlišného od námi použitého algoritmu JPEG (nejrozšířenější jsou LZW a PNG). Kompresi lze samozřejmě i zcela odbourat, avšak to může omezit přímou dostupnost dat prostřednictvím obecných internetových prohlížečů, zobrazujících formáty JPEG (komprese JPEG), GIF (komprese LZW) a v poslední době i nově doporučený PNG (komprese PNG). Řešení by samozřejmě existovalo i zde aplikací vhodného plug-in.

Problematika různých jazyků

Náš program klade mimořádný důraz na aplikace různých znakových sad pro vyjádření různých jazyků. Protože musí být schopen zapisovat i znaky mimo kód Latin1, tedy znaky jiné, než užívané jazyky západní Evropy, bude pravděpodobně nejlepším řešením užít kódu jednotného pro všechny jazyky, tzv. Unicode, a to jakmile bude dostatečně rozšířen a podporován. Do té doby budou hlavně při užití webovských prohlížečů vznikat různé problémy. Prozatím se jako do budoucna nejotevřenější a nejčistší přístup jeví kódování znaků s diakritikou pomocí znaků bez diakritiky v souladu s doporučeními SGML. Webovské prohlížeče bohužel dokáží správně interpretovat pouze diakritiku odpovídající znakové sadě Latin 1. Znak á je například kódován jako á, a české slovo láska je tedy zapsáno jako láska, což každý webovský prohlížeč správné zobrazí jako láska. Podle týchž doporučení SGML se české slovo řeka zapíše jako řeka, to ovšem webovský prohlížeč správně interpretovat neumí, a k správném přečtení takového znaku je proto třeba speciálního programu, jakým je například náš ManuFreT. Podobné problémy nastávají i u dalších nezápadoevropských jazyků užívajících diakritická znaménka - jde o daň za naši technologickou zaostalost v době počátků rozvoje HTML a příslušných prohlížečů. Ty dnes sice dokážou interpretovat různé znakové sady, avšak ne souběžně. Jelikož je třeba rozhodnout se na začátku pouze pro jednu jedinou znakovou sadu, zobrazí se specifické znaky jiných sad špatně - v prostředí WWW tedy například nelze na jedné stránce zobrazit znaky ř a Ź, protože každý z nich patří do jiné znakové sady. Je to škoda, neboť v pojetí SGML se složité znaky nevyjadřují jinak než prostřednictvím základní počítačové abecedy: latinských písmen bez diakritiky, tzv. ASCII. Situaci tedy vyřeší pouze výše uvedený Unicode.

Digitální dokumenty dlouhodobě použitelné

 

Náš program rozšiřuje jazyk WWW na jeho vývojové platformě SGML, což znamená, že jsou digitální dokumenty vytvářeny ve standardním prostředí na základě standardně deklarovaných definic. To je dobrým předpokladem dlouhodobé použitelnosti a dostupnosti těchto dokumentů, neboť každý z nich je na tyto obecně dostupné definice odkázán a pravidla jejich aplikace si ve zvláštním souboru nese s sebou. Tím je tento digitální dokument otevřen jakékoli příští interpretaci a je nezávislý na konkrétní počítačové platformě.

V budoucnu dojde zcela jistě k dalšímu vývoji grafických datových formátů, různých technických a technologických řešení, a určitě vzniknou i další přístupy k digitálním dokumentům. Při své práci i ve svých doporučeních se snažíme neuzavírat se před touto budoucností, a právě proto naše řešení staví na co nejjednodušším způsobu počítačového zápisu dat, z něhož vycházejí i námi bohatě využívané obecně přijímané standardy.

Naše řešení předpokládá zachování definovaného prostředí, případně jeho rozvoj na pozadí pravidel, podle nichž toto prostředí vzniklo. Přesto lze v diskutovaných oblastech zasadit do tohoto pevně definovaného rámce i jiné dílčí přístupy: jiné datové formáty nebo jiné znakové sady (například již dnes lze některá data na našem serveru digitalizace prohlížet v novém formátu DJVU). Aplikace SGML jsou možná syntakticky složité; tato syntax však vyniká pevnými pravidly a její nesmírnou výhodou je i skutečnost, že jako základní stavební kameny využívá textové objekty vyjádřené pouze v ASCII, tj. základní počítačové abecedě bez diakritiky.

Využití definovaného prostředí v praxi

Výhodou výše popsaného prostředí, podmíněného především rozšířením HTML na bázi SGML, je možnost týž dokument využít bez dalších úprav v prostředí WWW na internetu a zároveň jej zpřístupnit i pomocí speciálního softwaru. Především speciální software (v našem případě ManuFreT a návazné prostředky pro tvorbu dokumentů) umožňuje badateli nejen digitálně dostupný dokument studovat, pořizovat si v jeho rámci vlastní poznámky a pracovat podle potřeby s grafikou, ale publikovat rovněž získané poznatky v nové kritické digitální edici daného dokumentu nebo skupiny dokumentů. To je pro badatele neocenitelnou pomůckou.

Pro tvůrce digitálních kopií a zejména pro oba partnery, NK ČR a Albertinu icome Praha, pak toto řešení představuje velmi nadějné vyhlídky na dlouhodobé uchování digitálních kopií bez ohledu na měnící se počítačové prostředí. Dobře definovaná struktura a užití velmi rozšířených formátů totiž umožňují nejen snadné kopírování dokumentů na jiná média - a to i v případě zastarání stávajících CD-ROM - ale i konverzi dat a metadat do jiných příštích struktur.

Tato schopnost strukturální proměny, nazývaná migrací dat, je hlavní podmínkou dlouhodobého uchování a dlouhodobé dostupnosti dat. Stala se i podnětem k tomu, abychom založili digitální archiv.

Rukopisy z hlediska badatele: od popisu digitální kopie k novému badatelskému prostředí

Z pohledu odborníka na staré rukopisy byla zpočátku digitalizace originálních dokumentů spíše technickou disciplínou, která sice probíhá souběžně s ostatními způsoby zpracování, avšak jinak je záležitostí spíše okrajovou. Až později se ukázalo, že opak je pravdou, že digitální svět je schopen dát klasickému bádání novou dimenzi.

Počátkem devadesátých let se často hovořilo o digitalizaci jen jako o prostředku uchování a ochrany vzácných fondů, tedy o činnosti v mnohém podobné například mikrofilmování: uživateli měla být prostě namísto originálu poskytnuta jeho kopie. Šlo o metodu nepochybně užitečnou, pro odborníka ovšem ještě lepší způsob ochrany rukopisu představuje pořízení jeho edice, nikoli pouze zhotovení jeho kopie, a to ať už se jedná o klasické faksimile, mikrofilm či digitální kopii. Do popředí se tedy dostala otázka, jak tento požadavek ztvárnit v prostředí digitálního dokumentu a postupně i ve skupině těchto dokumentů.

Přirozeným závěrem, vzešlým z takovýchto úvah, byla myšlenka doplnit digitální kopii originálního dokumentu nějakou dodatečnou informací, která by pouhé surové faksimile blíže představila. Zbývalo vyřešit, jak tento nový přístup uvést do souladu s metodami i předmětem zájmu dřívější vědecké práce.

Dosavadní klasická pravidla pro popis dokumentů - v české verzi platná od druhé poloviny šedesátých let - totiž chápou rukopis jako fyzický objekt a soustřeďují se tudíž především na jeho vnější znaky, kdežto jeho často velmi rozmanitému a bohatě strukturovanému obsahu příliš pozornosti nevěnují. Popisují originál viděný zvenčí.

Popis u digitální kopie má funkci zcela jinou: vztahuje se vlastně k náhradnímu dokumentu, který si zdaleka nezachovává všechny vnější znaky originálu. Klasickou metodu popisu zaměřeného na fyzickou podobu objektu tedy nelze využít, neboť vnější znaky originálního dokumentu a dokumentu náhradního (odvozeného) nejsou totožné.

Co je však totožné, jsou vnitřní znaky obou dokumentů, jejich obsah. Z prosté digitální kopie se stává virtuální kniha.

Snímání originálu probíhá rychle a rutinním způsobem. Příprava doprovodných popisných dat naproti tomu zabere mnoho času, a proto není možné soustředit se na edice, k jejichž pořizování se kloní klasická představa ochrany originálních rukopisných informací. Současný popisný standard digitální kopie má tedy prozatím spíše technický charakter, převažující nad charakterem odborným. Jeho smyslem je udržet především formu výsledného dokumentu. Je vlastně jakýmsi kontejnerem pro transport digitálních dat.

Počet digitalizovaných dokumentů roste a informace o nich jsou přístupné v základním informačním systému na internetu, schopném vybrané dokumenty zpřístupnit v plné formě. Přesto musí vzniknout i doplňkový systém, mnohem bohatší na obsahové informace, tedy vnitřní znaky rukopisů. Počáteční verze tohoto systému, založeného na analytickém rozpisu částí fyzických svazků rukopisů již byla zveřejněna na webovském serveru NK ČR.

Zde je třeba si uvědomit, že starý rukopis je něco úplně jiného než moderní vydaná kniha. Starý rukopis je totiž mnohdy fyzickým konglomerátem různých textů, které navíc velmi často pouze obměňují nějaký původní text. Existuje řada neidentických textů, které pramení z téhož zdroje, avšak během opisování nabyly různých forem, neboť snahou písaře bylo co nejlépe zprostředkovat podstatu sdělení, přičemž zachování přesného znění nebylo pokládáno za nezbytné. Vždyť ani jednotlivé rukopisy Bible neříkají textově úplně totéž. Ve sbírkách NK ČR je například tzv. Velislavova Bible, která vypráví pomocí obrazů a šetří textem, aby vyjádřila totéž základní sdělení možná - dle mínění písaře - dostupnější formou. Podobnou metodu vlastně používá i filmové zpracování téhož tématu. Události kostnického koncilu, během něhož byl upálen Jan Hus, podrobně popsal jejich přímý svědek, kostnický měšťan Ulrich Riechental v Kronice Kostnického koncilu, která se nedochovala. Jejích sedm opisů se přitom od sebe zásadním způsobem liší. Ze dvou exemplářů ve vlastnictví Národní knihovny je jeden (německý) textově velmi bohatý a rozsáhlý (přes 500 stran), zatímco druhý (latinský), čítající jen něco málo přes 70 stran, se hemží obrázky, neboť písař byl očividně přesvědčen, že celá historie vyzní nejpůsobivěji právě prostřednictvím obrázků.

Ukazuje se, že ona nově vytvořená, textově orientovaná databáze rukopisů bude s to znovu svést různé formy týchž základních sdělení (například různé opisy téhož díla) dohromady. Umožní tak výrazně prohloubit poznatky o naší kulturní minulosti. I k tomu je tedy digitalizace rukopisů užitečná, nehledě na to, že se s její pomocí podaří nabídnout kopie do té doby jen ztěží dostupných dokumentů takřka celému světu. Digitalizace současně prostřednictvím internetu nabízí badatelům nebývalý prostor nejen k publikování výsledků své práce, ale zároveň i k mezinárodní odborné debatě a novým způsobům vědecké práce.

Rozšíření programu

Naše činnost v oblasti digitalizace není v současné době spjata už jen s UNESCO, neboť nám zajistila řadu dalších zajímavých a užitečných kontaktů po celém světě. Přijali jsme například účast na projektu zemí G7 s názvem Bib-liotheca Universalis (v květnu 1999 byla podepsána dohoda o společném postupu) a navázali jsme vztahy s americkou organizací Digital Library Federation. Účastníme se mezinárodních konferencí a seminářů, v poslední době nabývá na důležitosti v mezinárodním měřítku také naše role školicí a konzultační.

Přesto však považujeme za nejdůležitější svou angažovanost v programu UNESCO Paměť světa, kde se aktivně účastníme jak práce jeho Mezinárodní poradní komise, tak i prací její Subkomise pro technologii.

S příznivým ohlasem se setkává i publikování výsledků naší práce (aplikované standardy, doporučení, software, ukázky strukturovaných dat speciální produkty) na CD-ROM i klasicky. Digitalizačním projektům pak v neposlední řadě vděčíme rovněž za rozvoj mezilidských vztahů i profesionální spolupráce mezi našimi odborníky na rukopisy a jejich zahraničními kolegy.

Technický vývoj jde nezadržitelně vpřed obrovskou rychlostí bez ohledu na kulturní svět vzácných dokumentů. Snažíme se proto odhadnout trendy příštího vývoje a spoléhat na technologie splňující předpoklady pro dlouhodobou životnost. S tím souvisí i snaha maximálně omezit závislost našich dat na konkrétním hardwaru a softwaru.

Kvalitní a výkonnou techniku se snažíme využít co možná nejvíce ku prospěchu vhodných dokumentů a o své poznatky jsme ochotni se podělit i s jinými držiteli významných vzácných originálů.

Informace o programu Memoriae Mundi Series Bohemica jsou přístupné na serveru digitalizace http://digit.nkp.cz; kromě odborných příspěvků a zpracovaných standardů a doporučení jsou na serveru jak databáze digitalizovaných (a rozpracovaných) dokumentů, tak i databáze tzv. analytického rozpisu rukopisů (textový katalog). Sever zpřístupňuje rovněž bohaté ukázky digitalizovaných rukopisů a několik zvukových nahrávek. Umožňuje též získání nezbytného speciálního softwaru včetně výše uvedeného ManuFreT, obsahuje odkazy na příbuzné programy. V současné době je digitalizováno nebo těsně před dokončením na 250 svazků rukopisů, přičemž dalších 200 je v různém stupni rozpracovanosti. Na základě objednávky je možné zakoupit digitální kopii požadovaného rukopisu na CD-R k badatelským účelům.


Pozn.: V příspěvku autor využil texty z publikace Memoriae Mundi Series Bohemica: digitální zpřístupnění vzácných dokumentů / Adolf Knoll a Stanislav Psohlavec ve spolupráci s Charifem Bahbouhem, Jitkou Charvátovou a Zdeňkem Uhlířem (Praha, Národní knihovna ČR aj. 1998), vydané ke Katalogu arabských rukopisů Národní knihovny ČR na CD-ROM.