Propojení analytických záznamů s plnými texty a optimalizace zpřístupnění plných textů (VaV, MKČR, r. 1999-2003) - Stručný výtah
Resumé
Náplní projektu je propojení analytických záznamů zpracovávaných v Kooperačním systému článkové bibliografie s plnými texty a optimalizace zpřístupnění plných textů. Byla stanovena optimální kombinace plných textů k propojování: plné texty (deníky, některé časopisy) získávat z databáze TamTam a následně extrahovat a editovat metadata, generovat (Dublin Core, UNIMARC, URL, SICI) – importovat biliografický záznam do báze ANL, plný text s metadaty do báze ANL FULL (zde generovat HTML,XHTML,XML; z báze ANL staticky propojovat volné plné texty na WWW z odborných časopisů. Báze ANL a ANL FULL jsou propojeny přes statické URL, dynamická URL je generovaná při vyhledávání v ANL FULL. V Jednotné informační bráně je možné statické linkování i linkování přes OpenUrl, resp. SFX. Propojení na zdrojový dokument se realizuje pomocí SFX. Tendence je otevřené propojování s plnými texty vystavenými na webu i organizovanými v databázích pomocí OpenURL a SFX. Úspěch propojování předpokládá jednotnou formu ukládaných metadat a minimální chybovost (rozsáhlé korektury báze ANL). Portál Periodika na WWW zpřístupňuje plné texty ve struktuře oborové a regionální. Optimalizace zpřístupnění plných textů z věcného hlediska předpokládá integraci pojmového vyhledávání s vyhledáváním pomocí řízených termínů. Propojení přes OpenURL může jít hypoteticky až na úroveň plnotextového vyhledávání.
Systém TOPIC, ve kterém je budovaná báze ANL FULL, je založen na pojmovém vyhledávání a na interakci s uživatelem. Uvedené nástroje umožní v budoucnu optimalizovat zpřístupnění i českých odborných textů. Pro přístup do databanky českých plných textů TamTam bylo založeno konsorcium Anopress.
Vlastní řešení
Cíle projektu byly realizovány ve dvou základních liniích:
a) propojení analytických záznamů zpracovávaných v kooperačním systému článkové bibliografie
b) optimalizace zpřístupnění plných textů.
Základní oblasti či rámce, ve kterých se základní linie naplňovaly
3. Průběžné průzkumové a rešeršní práce týkající se zdrojů článkových informací a systémů zpřístupňování a propojování českých plných textů s analytickými záznamy, jejich organizace, používaných standardů atd. - globální pohled s ohledem na současný a budoucí vývoj zpřístupňování článkových informací a plných textů v ČR.
Plné texty jsou organizovány na Internetu do tematicky, regionálně nebo jinak utříděných služeb. Jsou přístupné přes vyhledavače, jsou utříděny do kategorií, zpřístupněny na různých portálech a zpravodajských serverech, v informačních branách, digitálních a virtuálních knihovnách v rámci kooperace příslušných institucí. Některé knihovny a instituce vytvářejí soupisy volných českých zdrojů plných textů na Internetu a zdrojů, které vydávají. Jsou zpřístupněny licencované zdroje zahraničních plnotextových databází a je založeno konsorcium Anopress pro multilicenční přístup k českým plným textům. V ČR jsou přístupné i zahraniční tzv. alerting services. V řadě knihoven je funkční elektronické dodávání dokumentů. Plnotextové zdroje se s analytickými záznamy propojují staticky, dynamicky, pomocí OpenURL a SFX.
Článkové databáze přístupné v Jednotné informační bráně
Báze ANL a ANAL (Olomouc) zpřístupněna v JIB pro vyhledávání. Báze ANL FULL a články krajské knihovny v Liberci zpřístupněny v JIB jako odkaz. Plné texty báze ANL FULL jsou přes bázi ANL přístupné v JIB pro externí uživatele na 1 den. V řešení jsou připojení dalších institucí a zdrojů, např. Anopress.
Nástroje použité v Jednotná informační bráně (JIB) nabízí možnosti linkování na přidané služby k vyhledaným bibliografickým dokumentům. Nabídku odkazů na relevantní služby v rámci JIB zajišťuje SFX server. Pro snadné vyvolání SFX nabídky je k dispozici Citation linker. Využití pole 856 pro přímé linkování na záznam v OPACu a na plný text.
Bibliografické zpracování článků v ČR
Bibliografické zpracování článků v ČR je poměrně rozsáhlé co do zdrojů, které se analyticky zpracovávají, tak co do typů institucí, které tuto činnost provozují.
Národní knihovna ČR zpracovává výběrově bibliografické záznamy článků ze všech druhů seriálů (noviny, časopisy, odborná periodika, sborníky) v rámci Kooperačního systému článkové bibliografie (KOSABI), ve kterém spolupracuje v současnosti 8 krajských knihoven a MZK, specializované odborné knihovny (STK, ÚZPI, SPKK-ÚIV, ČSAV, experimentálně ČGÚ). Spolupráce je navázána se 4 novými krajskými knihovnami. Na základě této spolupráce vzniká souborná databáze ANL. V systému LANius, resp. Clavius se zpracovávají bibliografické záznamy článků v knihovnách veřejných knihoven. V budoucnu je třeba sladit systém KOSABI a LANIUS tak, aby nedocházelo k duplicitnímu zpracování. Instituce spolupracující v rámci KOSABI přecházejí na nové SW vyšší generace. V krajských knihovnách v Kladně a Liberci se články popisují v systému RAPID, resp. ARL, v MZK v Brně v ALEPH, v Olomouci též. V Ostravě, v Českých Budějovicích a Ústí nad Labem v systému T-Series. V Hradci Králové, ÚZPI, STK, SPKK-ÚIV přetrvává ISIS. V krajské knihovně v Plzni se v r. 2003 rok instaloval ALEPH (články dříve zpracovávány v KIMS). V nově konstituovaných rajských knihovnách v Pardubicích a Zlíně se používá KP-Sys, resp. KP-Win, v Karlových Varech a Havlíčkově Brodě systém LANIUS, resp. Clavius. Knihovny pracující v ALEPHu přešly na verzi 14.2.4.
Data kooperačního systému jsou zpracovávána ve nebo konvertována do formátu UNIMARC, respektují se pravidla popisu AACR2, ISBD, Guidelines for the application of the ISBDs to the description of Component Parts s respektováním mezinárodních standardů věcného popisu - MDT-MRF pro oblast systematické indexace. V oblasti verbální věcné indexace se kombinují klíčová slova, věcné obecné kategorie a předmětová hesla a kontrolují se proti souborům autorit (v některých knihovnách) . Vyváženost vazby mezi jednotlivými vrstvami popisu je klíčovým momentem. V rámci kooperačního systému byla stanovena pravidla pro výběr titulů k popisu (na základě územní gesce - tituly regionální a celostátní provenience a dále pak na základě odborného zaměření). V rámci KOSABI jsou stanoveny zásady výběru článků co do úplnosti i co typů. V roce 2003 probíhaly v NKČR práce na konverzi UNIMARC MARC 21.
Výzkumný záměr NK Propojení analytických záznamů s plnými texty a optimalizace zpřístupnění plných textů - je projekt analyticko-koncepční a připravuje půdu pro praktickou realizaci účelového projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat (VaV, MKČR, 2000-2004).
Náplní projektu je optimalizace integrace a správy heterogenních dat souborné databáze Kooperačního systému článkové bibliografie (KOSABI) – bibliografické báze ANL (ALEPH) a plnotextové báze ANL FULL budované v systému TOPIC. Bibliografické záznamy článků, publikovaných v českém periodickém tisku jsou postupně propojované s elektronickou podobou článku a metadata jsou uložena ve zdrojových kódech plných textů báze ANL FULL. Současně jsou metadata přístupná v podobě bibliografického záznamu v bázi ANL. Vývoj, správa a údržba plnotextové databáze probíhá ve spolupráci s firmou Anopress. V rámci projektu se vyvíjí také aplikace pro management Kooperačního systému článkové bibliografie.
4. Výběr vhodného partnera k realizaci projektu a systému pro zpřístupňování plných textů článkových informací v kooperačním systému z hlediska excerpční základny a plnotextové technologie v souvislosti s projektem Souborná databáze Kooperačního systému článkové bibliografie; výběr partnera pro realizaci multilicenčního zpřístupnění českých plných textů v rámci konsorcia.
5.1 Analýza excerpční základny a plné texty na českém webu
5.2 Vytvoření základní, ale flexibilní koncepce zpřístupnění plných textů ve vazbě na Kooperační systém článkové bibliografie z hlediska zpracovávaných titulů v kooperačním systému, standardizace a nástroje – cíle koncepce, které byly naplněny zejména díky realizačnímu projektu Souborná databáze Kooperačního systému článkové bibliografie …
6. Dílčí koncepční řešení a dílčí praktické aplikace a realizace, které doplňují programový projekt Souborná databáze kooperačního systému článkové bibliografie – optimalizace integrace a správy heterogenních dat.
7. Zakoupení licence pro ultranet a internet pro TOPIC, resp. Portal One (Verity Information Server), technické podpory.
Během řešení projektu byla zakoupena neomezená licence pro Internet.
8. Návrhy optimalizace zpřístupnění plných textů v ČR