Národní knihovna. Knihovnická revue - obrázek
zpět na obsah čísla - tlačítko
Rok 2001, č. 1, s. 18-25  

VYHLEDÁVÁNÍ INFORMACÍ I.  UMĚNÍ ČI VĚDA?

Richard Papík
Ústav informačních studií a knihovnictví FF UK

Neexistuje nic  tak  samozřejmého,  aby to  mohlo být  přijato bez  otázky.
R.  Parry
1. Digitální společnost, organizace vědomostí  a jejich vytěžování

Klíčem k úspěchu je dnes schopnost inovovat a neustále zdokonalovat, pružně podnikat a vzdělávat. Klasické byrokratické hierarchie se mění. Pro organizace nového typu existuje několik pojmenování. Peter DRUCKER ji nazývá "síťová organizace", Peter SENGE vytvořil pojem "učící se organizace", jiní jako DAVIDOW  přichází například s názvem "virtuální podnik", Tom PETERS "bláznivá organizace", James Brian QUINN "inteligentní podnik" [TAPSCOTT, 1998, rovněž 1999]. Úspěšnost a schopnost obstát v konkurenci (která navíc může přijít odkudkoliv díky digitalizovanému a síťovému prostředí) záleží především na dobrém managementu organizací, a to organizací a institucí všech typů.
J. B. HARRELD [1998, s. 60-76] přisuzuje 3 důležité role managementu v  "digitalizované"  společnosti:

• řídit informační toky
• řídit inovace a tvorbu  intelektuálního vlastnictví
• řídit neustálé procesy učení

Všechny tyto 3 role neplatí jen pro podnikové prostředí, ale je možno vidět výrazné souvislosti s informačními institucemi a s moderními informačními službami. Realizační prostor pro informační pracovníky je velmi široký a byla by škoda, kdyby se této výzvy ze strany oboru informační a knihovní věda jak v teoretické, tak i v praktické oblasti nevyužilo.

K tomu bude využita zákonitě celá řada technologických nástrojů a metod, a to především:

vytěžování médií (media mining)  ... umění informaci nebo znalost  vyhledat a použít
zdroje, "studnice" znalostí (knowledge repositories) ... umět informaci a znalost organizovat pro další použití, zejména se jedná o "organizaci" v elektronických systémech - v bázích dat, digitálních knihovnách, ale i v knihovnách jako takových, neboť nezáleží na médiu, ale na synergii médií a forem
• nástroje spolupráce a součinnosti  (collaborative tools)

Ony nástroje jsou a budou spojeny s metodami vytváření nových databází, také ale právě proto i s novou generací vyhledávacích prostředků  v prostředích více sofistikovaných (databázová centra, digitální knihovny, "agregátoři" dat, producenti informačních zdrojů pro vědu a výzkum) a v prostředích v současnosti "méně sofistikovaných" a méně uspořádaných (internet jako takový, zde např. sledujeme překvapující nové generace search engines, intelligent agents, robots, spiders, snahu o vytvoření účinného světa metadat a mnoho dalších aktivit, které ovlivní internet v budoucích letech v oblasti jeho "obsahové správy").

Informační potřeby a následně formulované informační požadavky uživatelů jsou více a relevantněji naplňovány novými formami a způsoby vytěžování zdrojů. Metody typu "text mining" se jeví jako velmi účelné a perspektivní, neboť 80 % všech světových elektronických dat je uloženo v textové podobě. "Bohatství každého slova" je zatím často nevyužito. Současné vyhledávací prostředky tak nečiní s ohledem na budoucnost, ale právě v nových inteligentních vyhledávacích a analyzujících prostředcích půjde o problematiku efektivnějšího vytěžení multimediálního světa, který nám poskytuje v posledních desetiletích neskutečné možnosti zpřístupnění nejen současného "informačního a kulturního bohatství", ale pomáhá nám dostat se právě i k bohatství minulému či "velmi" minulému, historickému. Pojmy jako text mining, data mining nebo web mining nabývají na konkrétní představě a zabývají se jimi i specializované odborné konference v oborech informační a knihovní vědy (např.  konference Internet Librarian, Online World, International Online Meeting, U.S. National Online Meeting). Lze dokumentovat  na následujícím příkladu, a to průnikově do jiných oborů, že problematika vytěžování informací má charakter konkurenční výhody:
IBM pracuje ve Francii s jednou firmou zabývající se měřením a zkoumáním veřejného mínění v oblasti automobilů na elektrický pohon a vizí dopravy budoucnosti. Firma analyzuje tisíce zpráv většího i menšího významu ze síťového prostředí a aplikuje technologie "text miningu" na třídění témat, vytipování nosných témat a trendů v názorech.

Efektivní vyhledávání informací a jeho  aplikování "ve správnou dobu správnými (poučenými a informačně připravenými) lidmi" je sice jen jedním, ale strategickým aspektem uspění v novodobém prostředí. Jsme již nyní součástí  společnosti znalostí, ve které schopnost vyhledat relevantní informace patří mezi konkurenční výhody, a nezáleží, v jakém pracujeme oboru. Je pochopitelné a nikoli rozporné, že exaktní obory, kde "stárnutí" informací probíhá rychleji, musí být více a důsledněji obeznámeny s informačním světem, neboť jinak to znamená propadat se do nižších pater výzkumu a vývoje a následně ztrácet hospodářsky. Ve společenskovědních disciplínách, kde čas plyne příznivěji z hlediska stárnutí informací, se naopak objevují neskutečné možnosti kombinace nových pohledů, které jsou umožněny díky pokročilým metodám vyhledávání a vytěžování informačních a znalostních zdrojů.

2.  Cesty k elektronickým médiím

Současné elektronické informační zdroje můžeme z hlediska cesty k nim všeobecně rozčlenit na:

• přístupné přes profesionální dialogové (synonymicky: interaktivní, on-line, online, spřažené) systémy, a to nezávisle na internetu, ale i prostřednictvím internetu;
• přístupné výhradně volně na internetu;
• přístupné neinteraktivně, tj. off-line (např. v podnicích, výzkumných institucích, ale ani v samotných databázových centrech off-line šíření informací nezaniklo, ale došlo k vymezení specifických rolí a v některých případech to zasluhuje podrobný rozbor);
• přístupné na optických médiích (nejčastější je dnes využíván optický disk typu CD-ROM);
přístupné v kombinacích právě uvedených způsobů

3.  Přístup k dialogovým systémům obecně

Není v tuto chvíli nutné více komentovat následující schéma [PAPÍK, 2000], ale jedním ze současných (možná však časově kratších a přechodných) výrazných trendů je mobilní komunikace se systémy - zdroji informací ("studnicemi") v prostředí WAP technologie.  V každém případě mobilní komunikace je záležitostí budoucnosti a informační služby jimi budou více zasahovány a budou se jí přizpůsobovat nejen metodami vyhledávání, ale i formáty dat. Jestliže se v poslední době knihovny (viz příspěvky v elektronické konferenci "Knihovna" ze začátku roku 2001) zabývají využitím WAP technologie, kterou však osobně nepřeceňuji, je to správný postoj, byť by mělo jít o experiment. V každém případě půjde řada věcí včetně například zkoumání uživatelského chování otestovat. Taková reakce ze strany knihoven je nesrovnatelná se situací před několika lety a jasně dokumentuje, že "konkurenční výhoda" je reálnou záležitostí i pro informační instituce a knihovny. Nereagovat na nové uživatelské prostředí by znamenalo zaostávat a nebýt v blízké budoucnosti partnerem lidí, co informace a znalosti potřebují velmi rychle.

dialogové systémy obecně - obrázek

4.   Vyhledávání informací koncovým uživatelem versus vyhledání informací zprostředkovatelem - informačním specialistou

Zprostředkovaná i přímá informační obsluha se posouvá kvalitativně a kvantitativně do jiných rovin. Existuje současná (konkurenční) orientace výrobců systémů a producentů dat a šiřitelů dat (např. databázová centra) na koncového uživatele přes přátelská rozhraní (user-friendly interface, human-centered interface). Informační prostředník (information broker) a jeho role se posouvá do nových směrů [RUGGE - GLOSSBRENNER, 1994].
V síťové struktuře dnešních systémů jsou běžně uplatnitelné hypertextově orientované struktury, které nově ovlivnily vyhledávací metody a rovněž chování uživatelů při vyhledávání informací (např. "browsing" vs. "analytické" způsoby vyhledávání). V budoucnu se dá předvídat širší uplatnění i dalších technologií, jako jsou např. neuronové sítě aplikované do informačních sítí a prostředků vyhledávání. To umožní koncovému uživateli pracovat  s informačními systémy ještě více samostatněji a cíleněji. Role informačního specialisty, např. rešeršéra, se posouvá dále [O'LEARY, 1993, s.10-11], svým způsobem by to mohlo být i směrem k nové profesi typu "knowledge worker". Může to být ale i role v oblasti systémové analýzy a projektování, informační přípravy a uvádění nových produktů na informační trh, do institucí, firem, uplatní se role informačních konzultantů.
Zánik mezičlánků a jeho vysvětlení může být odvoditelné od některých novodobých komunikačních cest, např. zrodu digitálního dokumentu publikovaného ve webovském prostoru již na straně jeho producenta, nikoliv zveřejněného u vystavovatele (např. u databázových center). Přesto mezičlánek - prostředník se dostane do popředí, a to z důvodu jakési navigace ve světě informací a znalostí.
Koncový uživatel, člověk v komunikaci s informačním systémem či informační službou přímou či zprostředkovanou informační institucí nebo informačním specialistou, je středem celého problému, kolem kterého se odehrávají procesy vyhledávání informací. Není však nutné výhradně toto chápat jen jako důsledek "humanizace" přiblížení výpočetní techniky a informačních systémů člověku, ale je to zejména důsledek silného konkurenčního prostředí [např. KESSELMAN - WATSTEIN, 1988] v oblasti vývoje a provozování počítačových a informačních systémů a snahy oslovit zákazníka a produkt/službu mu prodat. Přes humanistické poslání řady informačních systémů (nejen ve vědě, školství, medicínských oborech, v kultuře) uplatnit se v lidské společnosti a v její pospěch, potažmo ve prospěch člověka, který si rozumí s "počítačem" i bez větších technických a technologických dovedností, tu dominuje ekonomický diktát.  Cílem je vyvinout nové (intelektuální kapitál), inovovat, a aspoň po krátkou dobu být na trhu "bezkonkurenční" či "konkurencí neohrožen", a umění a schopnost prodat.

Příklad:

Je možno dokumentovat prostřednickou roli již starším experimentem, který se konal v CAS - Chemical Abstracts Service v roce 1988. Týkal se sledování chování uživatelů [WARR - JACKSON, 1988, s. 68-72]. Po neformálních diskusích, které započaly mezi korporacemi CAS a ICI v roce 1984 a v nichž ICI zastávala  stanovisko, že chemici jsou nejvhodnějšími finálními uživateli, kteří mají být zacvičeni jako uživatelé dialogových bází dat, protože již mají zkušenosti z používání interaktivního systému, zacvičil během dalších dvou let štáb CAS 88 chemiků z ICI k využívání databáze CAS ONLINE. Cílem společného experimentu CAS a ICI bylo získat informace o potřebách chemiků - finálních uživatelů (final user) CAS ONLINE a o využívání této databáze. Výsledky posloužily také rozvoji CAS. V experimentu se jednalo o:

1. určení efektivity zacvičení pro používání CAS ONLINE pro finálního uživatele a pro informační pracovníky, kteří jim byli nápomocni, a zhodnocení vhodnosti příruček a dokumentace
2. zjištění problémů, s nimiž se finální uživatelé setkali
3. určení počtu a druhu rešerší, které je schopen denně udělat finální uživatel
4. prostudování efektivity vyhledávání finálního uživatele
5. určení druhu problémů při vyhledávání, které způsobily, že musí finální uživatel vyhledat pomoc informačního pracovníka
6. studování reakce informačních pracovníků na vyhledávání finálních uživatelů
7. prostudování reakce řídících pracovníků ICI včetně názorů chemiků i informačních pracovníků na efektivitu nákladů na vyhledávání finálních uživatelů
8. zjištění toho, jak by mohla CAS lépe sloužit potřebám vědců - finálních uživatelů

Experiment trval 24 měsíců (od prosince 1984 do prosince 1986). Zájem chemiků o experiment byl značný. Nejdříve jim vyhledávání informací zabíralo více času, než kdyby využívali jako prostředníka informačního pracovníka. Chemici však chtěli databázi využívat sami bez cizí pomoci.
Závěr k tomuto případu: pokud koncový uživatel v některých oborech (chemie je toho názorným příkladem) objeví schopnosti vyhledávat informace samostatně a má k dispozici příznivou časovou strukturu, existuje tu i zájem si rešerše realizovat sám. Obvykle je také lépe provádí, neboť obor detailněji zná a navíc zvládá úskalí informačních zdrojů a komunikace s nimi.

Koncovým uživatelem dialogového systému je možno označit uživatele, který se systémem komunikuje samostatně, bez pomoci zprostředkovatele a pravděpodobně bude informace samostatně získané interaktivním režimem z informačního systému i dále zpracovávat a aplikovat do svých výzkumů či jiných činností. Za jistých okolností můžeme považovat za koncového uživatele také  informačního pracovníka (například rešeršéra, "online retrieval specialist", "online searching specialist" apod.), který je uživatelem systému za účelem informační obsluhy "konečného" (finálního) uživatele a získané informační výstupy mu předává. Informační specialista - zprostředkovatel (information broker) se tak stává partnerem experta, pro kterého je výstup určen.
V tomto případě "konečný uživatel" nemusí být zatěžován problematikou informačního systému a vedením dialogu s ním, ale stačí mu pouze zformulovat informační požadavek vyplývající z jeho informačních potřeb. Informační požadavek zpracuje pak v realizaci informační pracovník, a to samostatně, nebo za přítomnosti konečného uživatele. R. VLASÁK cituje [1999, s.155-157] experta Carlose CUADRU, který doporučuje, aby konečný uživatel byl u zpracování přítomen. Pro naplnění relevantního výstupu ve smyslu pertinence (obsahové relevance) je to vždy žádoucí.
R. VLASÁK [1999] rozebírá celkem 3 způsoby, jak uživatel (vědecký pracovník, pedagog, manažer aj.) participuje na dialogovém zpracování rešerše a jak může zasahovat do procesu vyhledávání informací a být součástí interakce:

• Uživatel zadá požadavek pouze verbálně, komunikuje při zadání se zpracovatelem a realizátorem (firma, informační instituce, informační kancelář, knihovna) jeho požadavku písemně nebo osobně, případně telefonicky, faxem, dnes i elektronickou poštou, ale není u vlastního zpracování požadavku
• Konečný uživatel je přítomen s rešeršním specialistou u terminálu a rešeršní dotazy může usměrňovat v průběhu vyhledávacího dialogu, aby realizovaná rešerše byla především obsahově relevantní (pertinentní). Technologii komunikace provádí však informační specialista a uživatel jí nemusí být zatěžován
• Uživatel si požadavek zpracovává samostatně bez asis-tence informačního experta, což mu dnes v případě neznalosti dotazovacího jazyka umožňují systémy řízených menu, anebo graficky orientovaná rozhraní, často dnes na bázi hypertextu, s prvky intuitivního ovládání apod.

Zavedení pojmu  "konečný uživatel" a "koncový uživatel" se jeví pro výklad z pozice informační a knihovní vědy jako celkem důležité, neboť  se v komunikaci objevuje mezi uživatelem a systémem další prvek či dokonce více prvků v podobě informačních prostředníků. Z praktického hlediska tato terminologická záležitost není až tak podstatná.
Informační brokering může být typově rozlišován, např. dle druhů dokumentů (např. DDS broker), oborového zaměření, dle technologií (např. online specialista - rešeršér), které jsou využívány, dle právní formy subjektů (firma, databázové centrum, knihovna, informační středisko) i jinak. Tématem informačního zprostředkování se zabývá ve světě řada strukturně zpracovaných publikací a vychází i specializované časopisy, např. Information Services and Use. V podstatě jde o jeden z klíčových aplikačních výstupů oboru informační a knihovní věda. Za všechny prameny zabývající se informačním brokeringem ve světovém kontextu je možno uvést např. publikaci autorky S. RUGGEOVÉ [1995] sepsanou spolu s A. GLOSSBRENNEREM.
Jednou ze současných služeb spojených se schopnostmi vyhledávání informací je právě příprava (vzdělávání) uživatelů dialogových a s nimi provázaných služeb. Tento fakt zdůrazňuji a podporuji tezi o důležitosti přípravy uživatelů. Je to i v duchu přeměny role informačních pracovníků v určité poradce a školitele, kdy informační poradenství v éře řízení znalostí bude intelektuálně náročnou a uznávanou profesí, která doplní stále se zlepšující uživatelská rozhraní a navigační prostředky uživatelů v přemíře informačních zdrojů.
Aktuální je také brokering malých informačních podnikatelských subjektů [O'LEARY, 1988, s. 24-30, taktéž 1993]. A.S. WARNER [1988, s. 20-24] považuje informační poradenství za zajímavý podnikatelský obor. Konzultanti a malé konzultační firmy se stali součástí obchodního podnikání v informačním průmyslu. Smyslem takového podnikání jako informačního poradce je zprostředkovat efektivní využití dostupných informačních zdrojů nabízených světovými i regionálními službami. Zejména dialogové služby pro konečného - nezkušeného a neškoleného - uživatele tuto pomoc vyžadují (zejména pokud se tyto služby pojí k velkým databázovým centrům) a nezmění to ani fakt současné přátelskosti dialogových systémů via WWW rozhraní. I přes schopnost ovládat komunikaci s centrem ze strany uživatele tu hraje roli celá řada jiných dovedností a zkušeností, které koncový (resp. i konečný) uživatel nemohl většinou nikde nabýt, pokud k systému přistupuje poprvé.
Výběr databáze a hostitelského centra (hosta) na základě zkušeností či speciálních metod výběru (např. DIALINDEX, STN Index, CrossFile, CrossSearch, DIALOG Company Name Finder, DIALOG Product Codes Finder či DIALOG Journal Name Finder, příkazové funkce typu SELECT v STN International či RANK v DIALOG Corporation umožňující jednoduché srovnání dle určitých kritérií nám později však nápomocných v rozhodování, jaký zdroj je lépe využít, aj.) jsou jedny z nejpodstatněj-ších postupů rešeršní strategie, což je považováno už za know-how informačního poradce [blíže PAPÍK - MICHALÍK  -  MICHALÍK - NOVÁČEK, 1998, také PAPÍK, 2000].
Malé poradenské firmy tak, jak je popisuje A. S. WARNER [1988] nebo O'LEARY [1988], nacházejí místo i u nás  a nabízejí služby korporacím, které si nechtějí informační pracovníky držet zaměstnanecky. Využití je také možné, když korporace - v roli konečného uživatele - potřebuje řešit informační potřebu ve věcně jim vzdálených oblastech (např. patentové zdroje a na ně vázané služby a další zdroje průmyslově právní ochrany vyžadují odborníka s velkými zkušenostmi, zvláště pokud si chceme být jisti úplností informačních výstupů pro případ soudních - arbitrážních jednání, anebo právě preventivně před nimi).
Jednou z výhod podnikání v této oblasti je, že 75 % jednou zpracovaných podkladů pro konkrétní informační činnost může být několikanásobně informačními poradci využito. Ovšem při dodržení etických zásad obchodních a informačních. Tento marketingový prvek pak činí brokering informací podnikatelsky zajímavý.
V České republice je situace obtížnější, neboť lidé nejsou plošněji a detailněji informováni o důležitosti informačních zdrojů, často nemají základní informační dovednosti ve vztahu k externím zdrojům, nemají finanční prostředky a navíc je informační trh relativně omezený. Nicméně v některých specializovaných oblastech se již déle vytváří prostor pro vznik, existenci či přežívání malých firem informačního poradenství a brokeringu. Ve světě - zejména v USA - je situace příznivější, i když konkurenčně vypjatější, neboť subjektů na trhu je relativně mnoho.

Příklad:

Typickou organizací sdružující právě uvedené informační poradce může být Asociace nezávislých informačních profesionálů (AIIP, URL: http://www.aiip.org). Zajímavým postřehem je fakt, že tito lidé se sdružují kolem periodik DATABASE a ONLINE (blíže možno http://www.onlineinc.com) věnujících se problematice dialogového vyhledávání a dialogových služeb. Z činnosti a z osobní komunikace se členy AIIP usuzuji, že například v USA je to dobrý a efektivní příklad malého, ale svobodného podnikání. Malé subjekty informačního trhu  žijí v symbióze s velkými subjekty informačního prostředí.

Přes přátelská uživatelská rozhraní systémů  jsem názoru (na základě pozorování a vyhodnocování vlastních praktických zkušeností), že především navigace a orientace  a případná volba informačního zdroje ve velké nabídce informačních zdrojů může být pro uživatele dezorientující až frustrující, pokud nemají předchozí zkušenosti. Konečný uživatel využívá  služeb informačního specialisty záměrně, aby ušetřil čas a ochránil se od případných stresů. Víceméně můžeme zde pracovat s pojmem outsourcing pro oblast informačních služeb.
Ve sdílené síťové ekonomice je nutné se zaměřit na činnosti, které jsou zvládány organizací nejvíce a nejlépe, a jiné činnosti delegovat mimo organizaci (v tomto případě mimo uživatele).  Z tohoto důvodu informační brokering poskytující služby konečným uživatelům má význam a perspektivu, budou-li se jiné subjekty na trhu takto moderně chovat v duchu outsourcingu.

5.  Je internet zadarmo a je internet jediným a nejlepším zdrojem informací?

Například internet, o kterém si většina uživatelů myslí, že je v podstatě zdarma a že řeší informační potřebu většiny uživatelů (což je mýtus), je dnes rozvíjen ve všech jeho službách, rozhraních, vyhledávacích mechanismech, filtrech, prostředcích obsahové administrace, technické a softwarové administrace, anebo tvorby dokumentů a bází dat prezentovaných a vystavených v síťovém prostředí právě proto, že se očekává dynamická a expandující doba e-commerce neboli elektronického obchodu. Nově vytvářené prostředky vyhledávání na internetu vznikají téměř zásadně s nějakým podnikatelským plánem, tedy pro účely e-commerce. Proč vznikají vyhledávací prostředky, to si vyžaduje speciální komentář přesahující rozsah příspěvku, anebo se k němu vrátíme později v odborném článku, který se bude věnovat problematice "search engines" v prostředí internetu.

Uživatelům, kteří začínají pronikat do internetu, lze jen doporučit strategie vyhledávání v prostoru internetu dělené do 3 kategorií [TKAČÍKOVÁ,  1996  nebo PAPÍK - MICHALÍK - MICHALÍK - NOVÁČEK, 1998] :

browsing (listování stránkami WWW)
starting points (startovní body)
search engines (vyhledávací nástroje)

Pro  účely e-commerce se velké mediální korporace (mj. zabývající se i vyhledávacími prostředky) sdružují, fúzují a jejich akcie na světových burzách (mj. dnes směřovaných do elektronických forem) jsou až nekriticky nadhodnocené (viz za všechny příklady akcie společnosti Yahoo na burze, http://www.yahoo.com).

Příklad:

Příkladem orientace IS/IT na koncového uživatele z pohnutek konkurenčních mohou být dnešní dialogové služby komerčních databázových center. Služby center a metody přístupu k nim jsou dnes zásadně postaveny na přívětivém uživatelském rozhraní a na principu grafického rozhraní (graphic user interface, GUI). Každé databázové centrum má kromě klasického ("konzervativního") přístupu na úrovni  textového režimu, který vyhovuje pokročilým uživatelům zvládajícím příkazový jazyk, také hypertextově orientovaný WWW přístup. Hypertextově orientované rozhraní se zavádělo v posledních letech a jednotlivá světová databázová centra se doslova předháněla, čí nabídka bude v rozhraní WWW úplnější a s lepšími vyhledávacími rozhraními. Jejich výčet  by byl neúměrně dlouhý, a proto odkazuji na publikaci PAPÍK - MICHALÍK - MICHALÍK - NOVÁČEK, 1998, s. 148-200.

Považuji orientaci dialogových informačních systémů (center) na uživatele jednotlivých pracovních stylů (výzkumník, učitel, obchodník apod.) nebo dokonce oborů (chemie, telekomunikace, strojírenství, medicínské obory aj.) za trend. Jde rovněž o významný obchodně-psychologický a marketingový prvek strategie těchto informačních subjektů producentského nebo zprostředkovatelského typu ve snaze uspět s nabízeným systémem a s jeho co nejvíce integrovanými službami u koncového uživatele. Tyto dialogové služby za účelem poskytnout uživateli potřebný druh či typ informací se mohou vztahovat k jednomu systému, ale i k více systémům, stejně tak mohou spolupracovat podobné i rozdílné systémy (např. formou tzv. vstupních bran - gateways).
Jedním z takových příkladů "gateway" nového typu v éře hypertextové technologie jsou tzv. portály (portals, vortals), které integrují související informace a služby v co největším komfortu na "jednu plochu" webovského dokumentu. Uživatel tak má veškeré nabídky produktů a služeb, stejně tak propojení na další systémy a služby vizualizované v "jednom informačním" prostoru a v přijatelné konzistentní formě.

V poslední době portály zaměřené na uživatele poskytují i profesionální online centra [POYNDER, 1999, s.143-146]. Zřizování portálů typu Sci-Tech nebo Busi-ness se stalo dokonce předmětem konkurenčního boje (např. STN International - viz blíže http://www.cas.org nebo http://fiz-karlsruhe.de, Dialog Corporation - viz blíže http://www.dialog.com, Questel/Orbit - viz http://www.questel.orbit.com, GENIOS - http://www.genios.de, nebo GBI - German Business Information - viz  http://www.gbi.de  a mnoho desítek dalších). Cílem je poskytnout nejen uživatelsky přívětivý přístup k databázovým zdrojům, ale zároveň i další referenční informace, pochopitelně se zájmem dosáhnout co nejlepšího marketingového efektu při využití placených informačních služeb.

Systém se může cíleně zaměřovat speciálním uživatelským rozhraním a specificky vedenou komunikací na různé kategorie koncových uživatelů, jak už bylo naznačeno. Například současná databázová centra vytvářejí již zmíněné webovské portály, kde informace zde prezentované mají výhodu jednoho umístění a dále toho, že jsou provázány. Portály jsou orientovány na cílovou skupinu (například na obchodníky, právníky, informační specialisty nebo na vědeckou komunitu určitého oboru, začínající uživatele, pokročilé uživatele), anebo tematicky. Výběrově lze na základě zkušeností uvést časté orientace portálů:

• orientace na uživatele z oblastí obchodu, financí, ekonomiky
• orientace na odborníky ve farmaceutických oborech
• orientace na odborníky v medicínských oborech
• orientace na odborníky v chemických oborech
• orientace na odborníky v oblastech sociálních a humanitních oborů
• orientace na odborníky a zájemce o informace v oblasti intelektuálního vlastnictví (patenty, ochranné známky)
• orientace na právní a legislativní experty
• orientace na vědecké pracovníky
• orientace na uživatele ve školách
• orientace na nové uživatele s možností vyzkoušet bezplatné a zkušební přístupy ke zdrojům

6.  Současné přístupy k problematice vyhledávání informací

Na problematiku vyhledávání lze pohlížet mnohostranně a jako na mezioborovou disciplínu. Informační a knihovní věda se velmi intenzivně zabývá problematikou vyhledávání informací.  T. SARACEVIC [1997, s. 175-190] se spoluautorem P. KANTOREM a spoluautorkami A. CHAMIS, D. TRIVISON zmiňují několik základních směrů (každý z nich zasluhuje dlouhý a speciální rozbor):

• interakce s informačními systémy [BELKIN, VICKERY]
• informační potřeby a užití informací [DERVIN, NILES]
• psychologický výzkum v oboru human-computer interaction [BORGMAN]
• projektování systémů, např. založených na řízených menu [SHNEIDERMAN]
• online vyhledávání v databázích [FENICHEL, BELLARDO]

7.  Etapy vyhledávacího procesu

Rešeršní (vyhledávací) proces může být složen z následujících kroků [GOLDMANN, 1992, s. 75]:

• připojení (spolu s "logon" procedurou)
• výběr báze dat
• provedení rešerše
• tisk (resp. download) výsledků
• odpojení se od systému ("logoff" procedura)

Graficky můžeme vidět již konkrétní etapu vlastní relace také názorně na obrázku níže [BUDIL - KASTL, 1989]. Funkce tisku deklarovaná GOLDMANNEM [1992, s. 75] není ani v podstatě nutná, protože při použití funkce typu "capture" neboli záznamu relace do přechodného nebo předem nadefinovaného a pojmenovaného souboru jsou data uložena pro další zpracování a různé formy výstupů. Je dostatečné použít příkazu k zobrazení typu DISPLAY, TYPE, SHOW apod. V případě grafického rozhraní, příkaz může být nahrazen ikonou.

Průběh relace s dialogovým systémem - obrázek
 
 

Proces vyhledávání  informací v dialogových systémech raději rozšiřuji o model, který aplikuji do výuky nových uživatelů dialogových systémů a  studentů (zkoušeno a provozováno ve výuce na ÚISK FF UK v předmětu Rešeršní činnost vycházeje z praktických zkušeností rešeršního spe-cialisty) z důvodu jeho šíře souvislostí (viz následující obr.).
 

Model procesu vyhledávání informací v dialogových systémech - obrázek

8.  Elementy dialogového vyhledávání

Jedním z nejdůležitějších elementů efektivního procesu vyhledávání  jsou operátory. Booleovské (pojmenováno po Georgi BOOLEOVI, 1815-1864) operátory mají nejširší použití, ale také své limity. Booleovský model vyhledávání je velmi účinný, ale je rovněž velmi kritizován.  Mnohé dokáží napravit tzv. proximitní (vzdálenostní) operátory, jichž je několik druhů, ale vývoj postoupil dále. Některé vyhledávací systémy už pracují na principech tzv. fuzzy logiky, ale rozhodně to není běžné v největších a nejrozšířenějších informačních systémech. Velkou podporou klasických databázových systémů (sofistikovaných), ale i vyhledávacích prostředků pro internet, jsou proto proximitní operátory. Operátory a další elementy je obecně možno rozdělit:

• AND
• OR
• NOT
• (w), (n), (l), (a), (s), near, with, adj - proximitní
• ( )  - závorky

Vyhledávací systémy na internetu (search engines) nepracují zcela běžně s pokročilými metodami vyhledávání na principu používání "vyšších" operátorů - například proximitních (příkladem za všechny je AltaVista: http://www.av.com, http://altavista.digital.com). Je to však mnohdy výhodné: tvůrci totiž sázejí na intuitivní způsoby vyhledávání (za desítky možností příklad vyhledávacích internetovských prostředků: http://www.google.com nebo http://askjeeves.com).
 

Příklad použití operátorů - obrázek

Vyhledávání v prostředí sofistikovaných databázových zdrojů je stále nejefektivnější a nejrychlejší. Na začátku však potřebuje tento způsob získávání zdrojů alespoň základní informační dovednost a přehled. Naprostá většina uživatelů však o takových zdrojích, kde se vyskytují ty nejvhodnější - nejvíce relevantní - dokumenty, neví. Je to dáno několika bariérami. Ta finanční není vždy zásadní (viz například "konsorciální" řešení nákupu informačních zdrojů do ČR v rámci několika projektů, v roce 2000 díky zejména programu "LI - informační zdroje pro vědu a výzkum"). Z důvodu neznalosti, anebo i oněch finančních omezení, se mnozí uživatelé orientují pouze na "volně" přístupné informace na internetu, které jsou mnohdy bezcenné, anebo zkreslené. Dá se dokumentovat mnoha praktickými příklady, jak informace získané z internetu mají dezinformační charakter.

9. Hodnocení systémů

Problematikou vyhledávání se prolíná "čtveřice" po-jmů:

relevance
pertinence
úplnost
přesnost

Následující obrázek ukazuje vztahy mezi množinami dokumentů, které existují v procesu vyhledávání v dialogovém systému.

Vztahy mezi množinami dokumentů

Vztahy úplnosti a přesnosti je nejlépe pozorovat z následujících obrázků [KOWALSKI, 1997, s. 4-7] - první graf ukazuje ideální poměr a grafické vyjádření mezi přesností a úplností:

grafické vyjádření mezi přesností a úplností - obrázek
 

Druhý graf pak ukazuje reálný  funkční vztah mezi přesností a úplností:
reál. funkční vztah mezi přesností a úplností - obrázek
 

Závěr k úvodnímu článku o vyhledávání informací

Při vyhledávání a shromažďování informací se můžeme rozhodnout, zda chceme využít desítky až tisíce různorodých zdrojů na internetu, na které nás upozornily například vyhledávací nástroje, do kterých jsme vložili naše zájmová témata prostřednictvím klíčových slov (termínů) v logických kombinacích (booleovské, vzdálenostní operátory), anebo zda chceme pracovat se zdroji pokud možno soustředěnými do jednoho místa, resp. správněji do jednoho elektronického prostoru.  Těmito místy jsou databázová centra, téměř vždy založená na profesionálních a komerčních základech, přičemž je nutné navázat nejdříve smluvní vztahy a služby vždy uhradit.  Databázová centra, z nichž první vznikala už v 60. letech, byla a jsou přístupná po profesionálních sítích zcela nezávislých na internetu (např. SPRINTNET, TYMNET, NEXTEL, DATEX-P a desítky dalších větších sítí typu WAN - Wide Area Network).
K problematice vyhledávání v prostředí databázových center a digitálních knihoven se vrátíme v dalších pokračováních stejně tak, jako se vrátíme k vyhledávacím prostředkům na internetu. Tento příspěvek má rovněž za cíl dát problematiku do souvislostí informační a knihovní vědy (information and library science) a dalších oborů, které s ní sdílí rozhraní. Dílčím cílem bylo také umístit problematiku do souvislostí s problematikou knowledge managementu, která se informačních a knihovnických institucí výrazně týká.

 


Literatura:
 

  1. BUDIL, J. a KASTL, J. Automatizované informační systémy VTI - III. Praha : VŠE, 1989. 180 s.
  2. FAULKNER, CH. The essence of human-computer interaction. New York : Prentice Hall, 1998. xvi, 196 p.
  3. HARRELD, J.B. Building smarter, faster organizations. In: Blueprint to the digital economy : Creating wealth in the era of e-business. New York : McGraw Hill, 1998, p. 60-76.
  4. KESSELMAN, M. and WATSTEIN, S. B. End-user searching : Services and providers. Chicago : American Library Association, 1988. ix, 230 p.
  5. KOWALSKI, G. Information retrieval systems. Boston : Kluwer Academic Publ., 1997. xiii, 282 p.
  6. LAURSEN, J.V. Search engines and advertising : an unholy alliance? In: Online Information 97 Proceedings : 21th International Online Information Meeting, London  December 1996. Oxford : Learned Information Europe, p. 271-275.
  7. O'LEARY, M.  New roles for information searchers. Online, May 1993, vol. 17, p. 10-11.
  8. PAPÍK, R. Competitive Intelligence via Internet. In: Internet v riadení a obchode firmy : zbornik z 3. medzinárodnej konferencie konanej v dňoch 2. až 3. októbra 1997 v Bratislave. Bratislava : EL&T, 1997, s. 105-112.
  9. PAPÍK, R. Využití nových médií v marketingu. In: Marketing : jeho moderní a efektivní využití : sborník z konference Institute for International Research konané ve dnech 26.-27.5. 1997 v Praze. Wien :  I.I.R, 1997, s. 21-43.
10. PAPÍK, R., MICHALÍK, P., MICHALÍK, P. a NOVÁČEK, L. Internet - ekonomické, marketingové a finanční aplikace : strategie vyhledávání a prezentace. Praha : EKOPRESS, 1998. 220 s.
11. PAPÍK, R. Internet - ekonomické, marketingové a finanční aplikace : Strategie vyhledávání a prezentace. Národní knihovna, 1998, roč. 8, č. 5, s. 276-285.
12. PAPÍK, R. Dialogové vyhledávání a služby v kontextu "člověk-počítač" : disertační práce. Praha : Univerzita Karlova, 2000. 117 s.,  přílohová část  400 s., strojopis.
13. POYNDER, R. Online host to Sci-Tech portals. Online & CD-ROM Review, 1999, vol. 23,  no. 3, p. 143-146.
14. RUGGE, S. and GLOSSBRENNER, A. The information broker's handbook. New York : McGraw-Hill, 1995.  xxiii, 453 p.
15. SARACEVIC, T., KANTOR, P., CHAMIS, A.Y. and TRIVISON, D. A study of information seeking and retrieving : Background and methodology. In: Readings in information retrieval. San Francisco : Morgan Kaufman Publ., 1997, p. 175-190.
16. TAPSCOTT, D., LOWY, A. and TICOLL, D.  Blueprint to the digital economy : Creating wealth in the era of e-business. New York : McGraw Hill, 1998. xxi, 410 p.
17. TAPSCOTT, D.  Digitální ekonomika : naděje a hrozby věku informační společnosti. Brno : Computer Press, 1999. xviii, 350 s.
18. TKAČÍKOVÁ, D. Informační zdroje Internetu a jak je efektivně využívat. Praha : Výpočetní centrum ČVUT, 1997. 76 s.
19. VLASÁK, R.  Světový informační průmysl. Praha : Univerzita Karlova - Karolinum, 1999. 341 s.
20. WARNER, A.S. Information consulting - setting on the business. Online, 1988, vol. 12,  no.1, p. 20-24.
21. WARR, W.A. and JACKSON, A.R.H.  End-user searching of CAS ONLINE : Results of cooperative experiment between Imperial Chemical Industries and Chemical Abstracts Service. J. chem. Inform. Comput. Sci., 1988, vol. 28, no. 2, p. 68-72.
 

PhDr. Richard Papík, Ph.D.  působí jako odborný asistent a zástupce ředitele Ústavu informačních studií a knihovnictví FF UK.
 

zpět na obsah čísla - tlačítko