4. Výběr vhodného partnera k realizaci projektu a systému pro zpřístupňování plných textů článkových informací  v kooperačním systému z hlediska excerpční základny a plnotextové technologie v souvislosti s projektem Souborná databáze Kooperačního systému článkové bibliografie; výběr partnera pro realizaci multilicenčního zpřístupnění českých plných textů v rámci konsorcia.

 

Po analýze dostupných zdrojů na internetu bylo jednáno se společností Anopress a společností Newton. Společnost Anopress nabídla přístup do své databáze a on-line přebírání plných textů s poměrně podrobnými metadaty v nich vnořenými. Profil databáze TamTam z hlediska zdrojů odpovídal kategorii C a částečně B excerpční základny kooperačního systému.Databanka obsahuje i část vědomostní. Firma byla ochotna dát částečně své know how k dispozici. Dále byla firma ochotna zpřístupnit plné texty v rámci konzorcia.

Společnost Newton nebyla ochotna zpřístupnit svůj archiv a nabídla zasílání svých záznamů. Tento způsob spolupráce byl pro rutinní chod zpracování článků nepřijatelný. Rovněž cenové podmínky mluvily pro Anopress. Profil databanky společnosti Newton z hlediska koperačního systému je obdobný, nebyla vyloučena  eventuelní spolupráce v budoucnu.

 Jednat s jednotlivými vydavateli deníků a periodik by bylo neefektivní z časového důvodu, navíc zdroje obsahují z metadat většinou jen název článku a autora. Jednání proběhla např.  s nakladatelstvím Economia On Line.

V r. 1999. před zahájením projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat (VaV, MKČR, 2000.2004) bylo vypsáno výběrové řízení  na základě výzvy k podání nabídky pro poskytnutí přístupu do mediální a vědomostní databanky a na vývoj aplikace pro vyhledávání v plných textech a správu plných textů. V rámci projektu bylo vyvinuta iniciativa k vytvoření Konzorcia Anopress, která byla podepsána mezi SKIP a Anopressem v r. 2000.

 

Znalostní systémy v ČR jsou distribuované společností TOVEK (fulltextová technologie Verity -TOPIC, Verity Portal ONE, Verity K2 katalog)  a INCAD (systém Convera RetrievalWare). Problematikou znalostních systémů a vytěžováním informací, vyhledáváním v plnotextových databázích aj. se zabývají projekty a renomované konference jako je Datakon  a Znalosti.  

 

Z možných dostupných plnotextových systému byl vybrán systém TOPIC jednak proto, že NKČR mohla při jeho zprovoznění navázat na zkušenosti z rutinního chodu tohoto systému v Anopressu, jednak pro jeho interaktivní vlastnosti a schopnost pojmově vyhledávat na základě topiků. Ve svých vlastnostech se může ideálně doplňovat se systémem Convera Retrieval Ware vhodný zejména pro texty snímané OCR technikou.