5.2 Vytvoření základní, ale
flexibilní koncepce zpřístupnění plných textů ve vazbě na
·
Koncepce
propojování a zpřístupnění plných textů
1.
Deníky a některé tituly zpracovávat
v lince poloautomatické indexace/extrakce TTDE (TamTam
Data Extraktor) - extrakce dat
z plných textů, doplnění věcným popisem, později propojení na autority
nejdříve ručně, dále po vytvoření internetové verze formuláře pro editaci
- propojení údajů při zpracování na soubory autorit.
2.
Odborné časopisy propojovat staticky
z báze ANL (později, ne v tomto projektu, pomocí SFX s event. zabudovaným systémem DOI, resp. Gross Ref)
3.
Regionální tituly a některé odborná periodika zpřístupnit ve strukturovaném portálu Periodika na WWW.
4.
Metody propojování – metadata uložena v hlavičce plného textu (zpracování
plných textů v rámci linky TTDE), metadata
existující odděleně od plného textu (propojování bibliografických záznamů ANL
s volně dostupnými plnými texty).
Postup propojování
1.
V době neexistence linky TTDE vkládat částečnou adresu do bibliografických
záznamů ANL a následně propojovat s plnými texty neimportovanými do ANL
FULL.
2.
Zpětný import plných textů (odpovídajících záznamům báze ANL do báze ANL FULL) - vytvořen program pro vyhledání plných textů
v bázi TamTam na základě údajů uložených
v bázi ANL.
3.
Od poloviny r. 2000 zpracovávat vybrané tituly v lince TTDE (TamTam Data Extraktor – extrakce metadat,
doplnění a následné vložení metadat DC do hlavičky
plného textu pro bázi ANL FULL, import metadat
UNIMARC pro bázi ANL).
4.
Odborné tituly staticky propojovat z báze ANL.
Některé
tituly propojované staticky z báze ANL (kromě titulů zpracovávaných v lince
TTDE v současné době i v budoucnu) mohou být zpřístupněny pomocí OpenUrl a SFX
služeb. Závisí na dalším vývoji.
·
Standardizace
Definice
pracovního listu, výběr prvků Dublin Core pro záznam článku, konverze do UNIMARCu, XHTML, XML. Do linky zabudovat generátor SICI a
URN, též pole LKR pro propojení se zdrojovým dokumentem. Později propojení přes
SFX.
Definice
topiků -
kde je to možné definovat topiky na základě lexiky MDT. Koncepce věcného
popisu: analytické předmětové kategorie, předmětová hesla, omezeně klíčová
slova, MDT. Později (ne v tomto projektu) konspekt, anglické ekvivalenty).
Konverze
UNIMARC M21, její zabudování do linky TTDE, její průběžné ladění.
·
Linka TTDE (TamTam Data Extraktor)–
extrakce, korekce a doplnění metadat
Linka TTDE zahrnuje: speciální
aplikaci pro přístup do báze TamTam pro stahování záznamů (TamTam
Special NK), formulář
pro editaci, doplnění extrahovaných metadat a
generování metadat DC a UNIMARC na lokálních
pracovních stanicích (později internetová
verze s napojením na autority a možností oprav metadat),
program pro odeslání a import metadat UNIMARC (v UTF-8) do báze ANL a plných textů s metadaty DC do báze ANL FULL.
·
Plnotexové zpřístupnění v bázi ANL FULL v NKČR – server FULL.NKP.CZ a jeho správa
Instalace funkčního plnotextového systému s možností pojmového vyhledávání,
definice vyhledávání a zpřístupnění, správa a údržba systému.
Generování DC v HTML, XHTML,
definice tří formulářů pro vyhledávání (základní, rozšířený pro strukturovaná
data), rozšířený formulář pro s topiky.
Vyhledávání podle 17 rejstříků.
Zobrazení výsledku dotazu
s automaticky generovaným souhrnem článku, řazení podle relevance plus
různé způsoby zobrazení výsledků dotazu.
Formáty zobrazení:
uživatelské - jen metadata se souhrnem a
s hypertextem odkazů, metadat s odkazy a
s plným textem, metadata DC; pracovní – DC/HTML,
UNIMARC, XHTML a XML + a -.
Aplikace pro autorizaci a autentifikaci uživatelů, přístup přes login,
heslo, později.(ne v tomto projektu) přes proxy
server.
Administrace báze
(statistiky uživatelů a přístupů), prozatímní opravy, administrace portálu www
periodik.
Zálohování báze ANL FULL
(páska, zrcadlo, DVD).
Jsou
v komplementárním vztahu, ANL propojena na ANL FULL, zpřístupnění v JIB
(ANL pro vyhledávání, ANL FULL prozatím jako odkaz (později, ne v tomto
projektu, připojit přes Z39.50 a Open URL, resp. SFX;
propojení eventuelně dotáhnout až do plných textů; sbližování předmětových
kategorií s topiky, vztah předmětových kategorií konspektu, skupin
konspektu a analytických předmětových kategorií – nutnost sjednocení
v bázi ANL).
Zaměřit
se na opravy báze ANL, zejména autoritní tvary a
zdrojový dokument (sjednotit názvy a ISSN event.
ISBN) vzhledem k propojování přes Open URL a SFX
(propojení na zdrojový dokument přes ISSN/ISBN/název, ID; propojení věcných
údajů; propojení s ostatními bázemi a zdroji).
V budoucnu
propojování na základě citací a identifikátorů.
·
Periodikum
Národní knihovna
Digitalizace
periodika v Anopressu (do r. vydání 2001), od r.
1999 samostatná aplikace
ve formátu html, pdf,
rejstříky, current content,
příprava předmětových hesel pro toto periodikum.
Zpřístupnění
části digitalizované v Anopressu v bázi ANL FULL. V budoucnu (ne
v tomto projektu) plnotextové vyhledávání všech
ročníků a metadata DC.
·
Aplikace
pro Management Kooperačního systému článkové bibliografie (MNG KOSABI)
Vytvoření
aplikace pro Management kooperačního systému na základě vyvinutých aplikaci
CASLIN (upload záznamů, import do báze SKA, resp. ANL
KOSABI (různé kódy a formáty), kontrola na formální chyby a UNIMARC, export do ALEPHu nebo k dalším opravám, možnost exportu s kritickými
chybami a/nebo jen chybami UNIMARC, možnost editace záznamů, aplikace pro
titulovou základnu a on line dialog). V budoucnu eventuelně sdílená
katalogizace (ne v tomto projektu).
·
Spolupráce
Spolupráce
s institucemi v rámci KOSABI: zapojení nových krajských knihoven do
systému, průběžné ladění výstupu v UNIMARCu.
Spolupráce
s distributore/agregátorem plných textů
v tomto projektu, s vydavateli/nakladateli ne v tomto projektu.
V budoucnu
přichází v úvahu spolupráce s odd. elektronických
zdrojů NK, odd. věcných autorit, jinými institucemi, virtuálními knihovnami a
digitálními knihovnami, branami. Mezinárodní spolupráce – hledání
možného partnera.
·
Návaznosti
současné a budoucí
Na
referenční služby a document delivery,
odd. zpracování elektronických zdrojů, oddělení
autorit, oddělení věcného popisu Národní knihovny (v referenčním oddělení
zprovoznit elektronické dodávání dokumentů a stanovit ekonomické relace),
pravidla pro katalogizaci elektronických zdrojů, DC pro JIB, předmětová
kategorizace popisu zdrojů a fondů, autority. Odbor vydavatelský.
V budoucnu
propojení s Digitální knihovnou (ne v tomto projektu).
·
Zpřístupnění
a autorskoprávní problematika
Zpřístupnit
plné texty pouze NK a to pouze prohlížet a omezeně kopírovat, externí uživatele
omezeně (v současnosti 1 den se stejnými možnostmi) v tomto projektu
vzhledem k absenci legislativy v této oblasti. Eventuelní návrh
zpřístupnění báze ANL FULL v rámci konsorcia knihoven, v rámci
projektu Souborná databáze v r. 2004, externím uživatelům ne v tomto
projektu.
Založení
konsorcia Anopress po multilicenční zpřístupnění
plných textů