4. Výběr vhodného
partnera k realizaci projektu a systému pro zpřístupňování plných textů
článkových informací v kooperačním systému z hlediska excerpční základny a
plnotextové technologie v souvislosti s projektem Souborná databáze Kooperačního
systému článkové bibliografie; výběr partnera pro realizaci multilicenčního
zpřístupnění českých plných textů v rámci konsorcia.
Po analýze dostupných zdrojů
na internetu bylo jednáno se společností
Anopress a společností Newton. Společnost Anopress
nabídla přístup do své databáze a on-line přebírání plných textů s poměrně
podrobnými metadaty v nich vnořenými. Profil databáze TamTam z hlediska zdrojů
odpovídal kategorii C a částečně B excerpční základny kooperačního
systému.Databanka obsahuje i část vědomostní. Firma byla ochotna dát částečně
své know how k dispozici. Dále byla firma ochotna zpřístupnit plné texty v rámci
konzorcia.
Společnost Newton nebyla
ochotna zpřístupnit svůj archiv a nabídla zasílání svých záznamů. Tento způsob
spolupráce byl pro rutinní chod zpracování článků nepřijatelný. Rovněž cenové
podmínky mluvily pro Anopress. Profil databanky společnosti Newton z hlediska
koperačního systému je obdobný, nebyla vyloučena eventuelní spolupráce v
budoucnu.
Jednat s jednotlivými
vydavateli deníků a periodik by bylo neefektivní z časového důvodu, navíc zdroje
obsahují z metadat většinou jen název článku a autora. Jednání proběhla např.
s nakladatelstvím Economia On Line.
V r. 1999. před zahájením
projektu
Souborná databáze Kooperačního systému článkové bibliografie - optimalizace
integrace a správy heterogenních dat
(VaV, MKČR, 2000.2004) bylo vypsáno výběrové řízení na
základě výzvy k podání nabídky pro poskytnutí přístupu do mediální a vědomostní
databanky a na vývoj aplikace pro vyhledávání v plných textech a správu plných
textů. V rámci projektu bylo vyvinuta iniciativa k vytvoření Konzorcia
Anopress, která byla podepsána mezi SKIP a Anopressem v r. 2000.
Znalostní systémy v ČR
jsou
distribuované společností
TOVEK (fulltextová technologie Verity -TOPIC, Verity Portal
ONE, Verity K2 katalog) a
INCAD (systém Convera
RetrievalWare). Problematikou znalostních systémů a vytěžováním informací,
vyhledáváním v plnotextových databázích aj. se zabývají projekty a renomované
konference jako je
Datakon a
Znalosti.
Z možných dostupných
plnotextových systému byl vybrán systém TOPIC jednak proto, že NKČR mohla při
jeho zprovoznění navázat na zkušenosti z rutinního chodu tohoto systému v Anopressu,
jednak pro jeho interaktivní vlastnosti a schopnost pojmově vyhledávat na
základě topiků. Ve svých vlastnostech se může ideálně doplňovat se systémem
Convera Retrieval Ware vhodný zejména pro texty snímané OCR technikou.