5.2 Vytvoření základní, ale flexibilní koncepce zpřístupnění plných textů ve vazbě na Kooperační systém článkové bibliografie z hlediska zpracovávaných titulů v kooperačním systému, standardizace a nástroje – cíle koncepce, které byly naplněny  zejména díky realizačnímu projektu Souborná databáze Kooperačního systému článkové bibliografie …

 

·         Koncepce propojování a zpřístupnění plných textů

 

1. Deníky a některé tituly zpracovávat v lince poloautomatické indexace/extrakce TTDE (TamTam Data Extraktor)  - extrakce dat z plných textů, doplnění věcným popisem, později propojení na autority nejdříve ručně, dále po vytvoření internetové verze formuláře pro editaci -  propojení údajů při zpracování  na soubory autorit.

2. Odborné časopisy propojovat staticky z báze ANL (později, ne v tomto projektu, pomocí SFX s event.  zabudovaným systémem DOI, resp. Gross Ref)

3. Regionální tituly a některé odborná periodika zpřístupnit ve strukturovaném portálu Periodika na WWW.

4. Metody propojovánímetadata uložena v hlavičce plného textu (zpracování plných textů v rámci linky TTDE), metadata existující odděleně od plného textu (propojování bibliografických záznamů ANL s volně dostupnými plnými texty).

 

Postup propojování

 

1. V době neexistence linky TTDE vkládat částečnou adresu do bibliografických záznamů ANL a následně propojovat s plnými texty neimportovanými do ANL FULL.

2. Zpětný import plných textů (odpovídajících záznamům báze ANL do báze ANL FULL) - vytvořen program pro vyhledání plných textů v bázi TamTam na základě údajů uložených v bázi ANL.

3. Od poloviny r. 2000 zpracovávat vybrané tituly v lince TTDE (TamTam Data Extraktor – extrakce metadat, doplnění a následné vložení metadat DC do hlavičky plného textu pro bázi ANL FULL, import metadat UNIMARC pro bázi ANL).

4. Odborné tituly staticky propojovat z báze ANL.

 

Některé tituly propojované staticky z báze ANL (kromě titulů zpracovávaných v lince TTDE v současné době i v budoucnu) mohou být zpřístupněny pomocí  OpenUrl a SFX služeb. Závisí na dalším vývoji.

 

·         Standardizace

 

Definice pracovního listu, výběr prvků Dublin Core  pro záznam článku, konverze do UNIMARCu, XHTML, XML. Do linky zabudovat generátor SICI a URN, též pole LKR pro propojení se zdrojovým dokumentem. Později propojení přes SFX.

Definice topiků - kde je to možné definovat topiky na základě lexiky MDT. Koncepce věcného popisu: analytické předmětové kategorie,  předmětová hesla, omezeně klíčová slova, MDT. Později (ne v tomto projektu) konspekt, anglické ekvivalenty).

Konverze UNIMARC M21, její zabudování do linky TTDE, její průběžné ladění.

 

·         Linka TTDE (TamTam Data Extraktor)– extrakce, korekce  a doplnění metadat

 

Linka TTDE zahrnuje:  speciální aplikaci pro  přístup do báze TamTam pro stahování záznamů (TamTam Special NK), formulář pro editaci, doplnění extrahovaných metadat a generování metadat DC a UNIMARC na lokálních pracovních stanicích (později internetová verze s napojením na autority a možností oprav metadat), program pro odeslání a import  metadat  UNIMARC (v UTF-8)  do báze ANL a plných textů s metadaty DC do báze ANL FULL.

 

·         Plnotexové zpřístupnění v bázi ANL FULL v NKČR – server FULL.NKP.CZ a jeho správa

 

Instalace funkčního plnotextového systému s možností pojmového vyhledávání, definice vyhledávání a zpřístupnění,  správa a údržba systému.

Generování DC v HTML, XHTML, definice tří formulářů pro vyhledávání (základní, rozšířený pro strukturovaná data), rozšířený formulář pro s topiky. Vyhledávání podle 17 rejstříků.

Zobrazení výsledku dotazu s automaticky generovaným souhrnem článku, řazení podle relevance plus různé způsoby zobrazení výsledků dotazu.

Formáty zobrazení: uživatelské -  jen metadata se souhrnem a s hypertextem odkazů, metadat s odkazy a s plným textem, metadata DC; pracovní – DC/HTML, UNIMARC, XHTML a XML + a -.

Aplikace pro autorizaci a autentifikaci uživatelů, přístup přes  login, heslo, později.(ne v tomto projektu) přes proxy server.

Administrace báze (statistiky uživatelů a přístupů), prozatímní opravy, administrace portálu www periodik.

Zálohování báze ANL FULL (páska, zrcadlo, DVD).

 

·         Báze ANL a ANL FULL, JIB

 

Jsou v komplementárním vztahu, ANL propojena na ANL FULL, zpřístupnění v JIB (ANL pro vyhledávání, ANL FULL prozatím jako odkaz (později, ne v tomto projektu, připojit přes Z39.50 a Open URL, resp. SFX; propojení eventuelně dotáhnout až do plných textů; sbližování předmětových kategorií s topiky, vztah předmětových kategorií konspektu, skupin konspektu a analytických předmětových kategorií – nutnost sjednocení v bázi ANL).

Zaměřit se na opravy báze ANL, zejména autoritní tvary a zdrojový dokument (sjednotit názvy a ISSN event. ISBN) vzhledem k propojování přes Open URL a SFX (propojení na zdrojový dokument přes ISSN/ISBN/název, ID; propojení věcných údajů; propojení s ostatními bázemi a zdroji).

V budoucnu propojování na základě citací a identifikátorů.

 

·         Periodikum Národní knihovna

 

Digitalizace periodika v Anopressu (do r. vydání 2001), od r. 1999 samostatná aplikace ve formátu html, pdf, rejstříky, current content, příprava předmětových hesel pro toto periodikum.

Zpřístupnění části digitalizované v Anopressu v bázi ANL FULL. V budoucnu (ne v tomto projektu) plnotextové vyhledávání všech ročníků a metadata DC.

 

·         Aplikace pro Management Kooperačního systému článkové bibliografie (MNG KOSABI)

 

Vytvoření aplikace pro Management kooperačního systému na základě vyvinutých aplikaci CASLIN (upload záznamů, import do báze SKA, resp. ANL KOSABI (různé kódy a formáty), kontrola na formální chyby a UNIMARC, export do ALEPHu nebo k dalším opravám, možnost exportu s kritickými chybami a/nebo jen chybami UNIMARC, možnost editace záznamů, aplikace pro titulovou základnu a on line dialog). V budoucnu eventuelně sdílená katalogizace (ne v tomto projektu).

 

·         Spolupráce

 

Spolupráce s  institucemi v rámci KOSABI:  zapojení nových krajských knihoven do systému, průběžné ladění výstupu v UNIMARCu.

Spolupráce s distributore/agregátorem plných textů v tomto projektu, s vydavateli/nakladateli ne v tomto projektu.

V budoucnu přichází v úvahu spolupráce s odd. elektronických zdrojů NK, odd. věcných autorit, jinými institucemi, virtuálními knihovnami a digitálními knihovnami,  branami. Mezinárodní spolupráce – hledání možného partnera.

 

·         Návaznosti současné a budoucí

 

Na referenční služby a document delivery, odd. zpracování elektronických zdrojů, oddělení autorit, oddělení věcného popisu Národní knihovny (v referenčním oddělení zprovoznit elektronické dodávání dokumentů a stanovit ekonomické relace), pravidla pro katalogizaci elektronických zdrojů, DC pro JIB, předmětová kategorizace popisu zdrojů a fondů, autority. Odbor vydavatelský.

V budoucnu propojení s Digitální knihovnou (ne v tomto projektu).

 

·         Zpřístupnění a autorskoprávní problematika

 

Zpřístupnit plné texty pouze NK a to pouze prohlížet a omezeně kopírovat, externí uživatele omezeně (v současnosti 1 den se stejnými možnostmi) v tomto projektu vzhledem k absenci legislativy v této oblasti. Eventuelní návrh zpřístupnění báze ANL FULL v rámci konsorcia knihoven, v rámci projektu Souborná databáze v r. 2004, externím uživatelům ne v tomto projektu.

Založení konsorcia Anopress po multilicenční zpřístupnění plných textů