1
|
- Ivana Anděrová, NKČR
- Oddělení analytického zpracování NKČR
- KOSABI
- Anopress
|
2
|
- Článková bibliografie v tradičních podmínkách - 50.-80. léta (měsíční
tištěné sešity, VPK, MDT, rejstříky, retrospektiva 1945-52)
- Příprava automatizovaného zpracování článkové bibliografie - 80. léta (ASNBČ, Výměnný formát pro
bibliografický (dokumentační) a katalogizační záznam, MAKS a postupně v
následujících letech prováděcí projekty pro jednotlivé typy dokumentů
včetně článků)
- Poslední tištěné číslo - r. 1990, r. 1991 převeden z lístkových záznamů
do počítačové formy
- Návod pro tvorbu a využívání báze záznamů dokumentů, specifikace údajů a pravidla pro analytický popis
- r. 1991-1992
- Kooperační systém článkové bibliografie - r. 1992-2002 (r. 1992 - ověřovací provoz, od r. 1993 plný provoz, báze ANAL,
později ANL, koordinace, standardizace a metodika - postupně VF a ISIS,
ISBD/CP, AACR2R, UNIMARC a různé systémy, vybrané znaky MDT a MDT/MRF,
klíčová slova, předmětová hesla, předmětové kategorie, od r. 2000
zpracování bibliografických
záznamů z plných textů v NKČR a moderní metody zpřístupnění - DC, XHTML,
XML, projekty – báze ANL FULL)
|
3
|
- Systém zpracování článků v ČR - rozsáhlý co do zdrojů i typů institucí
(např. Národní lékařská knihovna aj.)
- Kooperační systém článkové bibliografie - „užší“ (NKČR, MZK, krajské
knihovny) a „širší“ (plus
oborové, resp. specializované knihovny) - NKČR, 8 krajských knihoven, MZK, STK,
SPKK-ÚIV, ÚZPI
- Kooperace po linii regionální a oborové
- Smluvní zajištění: Smlouva o sdružení pro Českou národní bibliografii
(r. 1998), Dodatek č. 3 (r. 2001) zajišťuje pokračování článkové
bibliografie v přechodném období související se změnou státoprávního
uspořádání ČR
- Souborná bibliografická databáze KOSABI - ANL a lokální databáze
spolupracujících institucí, plnotextová báze ANL FULL s metadaty
|
4
|
- Propojení analytických záznamů s plnými texty a optimalizace
zpřístupnění plných textů (VaV, MKČR, 1999-2003)
- Souborná databáze Kooperačního systému článkové bibliografie -
optimalizace integrace a správy heterogenních dat (VaV, MKČR, 2000-2004)
|
5
|
|
6
|
|
7
|
- Výběr zpracovávaných dokumentů je
orientován na širší odbornou veřejnost:
- A: seriály (časopisy, sborníky, ročenky) vydávané AVČR a vysokými
školami v ČR
- B: seriály (časopisy, sborníky, ročenky) vydávané ostatními institucemi
v ČR
- C: noviny (ústřední, regionální) a kulturně politické časopisy
- D: populárně naučné časopisy
- Vyloučena periodika místní, závodní a zábavného charakteru, časopisy pro
děti event. mládež
|
8
|
- A: 1
- B: 1 (sborníky, ročenky), 1-2 (odborné časopisy)
- C: 2, 3
- D: 3
|
9
|
- Faktograficky přínosné články
- Články odborné, články s dokumentární a uměleckou hodnotou
- Oficiální dokumenty (projevy, vyhlášení, komuniké, usnesení)
- Zprávy a informace o kulturních, sportovních, politických, vědeckých aj.
akcích (konferencích, seminářích, festivalech, jednáních, zasedáních,
výstavách, divadelních, rozhlasových a televizních inscenacích,
besedách, sportovních soutěžích)
- Souhrnné a hodnotící články, závažné polemiky, diskuze a komentáře
- Reportáže, biografické články (životopisné, jubilejní, nekrology,
rozhovory, profily osobností, vzpomínky)
- Literární texty (básně, povídky aj. ještě nepublikované, nové překlady),
fejetony, sloupky, úvodníky (pouze hodnotné)
- Recenze publikací různého zaměření, gramofonových desek, kompaktních
desek, filmů apod.
|
10
|
- Počet záznamů: ANL cca 730 000 bibliografických záznamů, ANL FULL 95 000
plných textů s metadaty
- počet zpracovávaných titulů: ANL - cca
212 v NKČR, 217 v regionech,
108 v odborných knihovnách, celkem cca 537 titulů; ANL FULL 30
titulů, běžně zpracovávaných zatím 16 v NKČR
- Časové pokrytí: ANL 1990/91 -, ANL FULL 1997-
|
11
|
|
12
|
- Výběrové článkové databáze
- Obory: všechny (lékařství a sport okrajově, technika posílila)
- Typy seriálů: ANL – kategorie A,B,C,D (omezeně); ANL FULL zatím
kategorie C
- Úplnost excerpce (výběr článků vzhledem k typům seriálů)
- Popis a formáty: ANL a ANL FULL - UNIMARC, AACR2, MDT-MRF, předmětové
kategorie, hesla, klíčová slova; ANL FULL navíc
DC, XHTML, XML
- ANL/ALEPH
- ANL FULL/linka zpracování bibliografických záznamů z plných textu/TOPIC
|
13
|
- V současné době ANL FULL vzniká
on-line v NKČR v rámci linky zpracování TTDE bibliografických záznamů,
resp. metadat z plných textů, které jsou získávány z databáze TamTam
(Anopress)
|
14
|
|
15
|
|
16
|
|
17
|
|
18
|
|
19
|
|
20
|
|
21
|
|
22
|
|
23
|
- Fulltextový pojmově orientovaný vyhledávací systém, pojmové vyhledávání
(concept retrieval) pomocí strukturovaných dotazů (topiců)
- Hodnocení důležitosti, relevance vyhledaných dokumentů vzhledem k dotazu
(relevance ranking), váhy
- Kvantifikace obsahu dokumentů
- Shlukování dokumentů podle společného kontextu (clustering) a vytváření automatické anotace -
sumarizace (summarization)
- Interaktivní vyhledávací systém – hledání dokumentů s podobným
obsahem - volný dotaz (Free Text
Query), dotaz příkladem (Query By Example)
|
24
|
- Dotaz - výraz složený ze slov a frází, který hledáme v dané databázi
- Topic - je předem definovaný uložený strukturovaný dotaz, resp. téma, které je tvořeno slovy,
frázemi, operátory a modifikátory; obsahuje informace o předmětu hledání
- Topic má podobu pojmového stromu,
na jeho nižších úrovních (větvích) jsou množiny dalších pojmů, resp.
témat, která jsou tvořena dále nedělitelnými klíčovými slovy (listy)
- Pojmový strom tvoří vyhledávací
podmínku pro dokumenty týkající
se určitého tématu
- Topic je konceptuální popis
znalosti o dané problematice ve formě znalostního stromu
- Definice topiců tvoří tzv. znalostní bázi
|
25
|
|
26
|
|
27
|
- Čtyři způsoby hledání: pole dotaz, pomocí formulářů, pomocí topiců,
resp. témat (předem strukturovaných dotazů), pomocí rejstříků
- Tři druhy dotazů: prostý dotaz, formulářový dotaz, tematický dotaz
- Tři druhy formulářů: základní, rozšířený, rozšířený s tématy
- Seznam výsledků: jednoduchý, se souhrnem, seskupený
- Třídění seznamu: skóre, výsl./str., vlastní třídění
- Zobrazení metadat: uživatelské formáty, pracovní formáty
- Rejstříky - nadefinováno 17 rejstříků
|
28
|
|
29
|
|
30
|
|
31
|
|
32
|
- Začlenění linky zpracování do předpokládaného možného vývoje
- Předpoklad: strukturované údaje, resp. údaje Dublin Core v textových
formátech, resp. HTML formátu
|
33
|
|
34
|
|
35
|
|
36
|
|
37
|
- Začlenění krajských knihoven v Pardubicích, Karlových Varech, Havlíčkově
Brodě, Zlíně
- Přerozdělení titulů, kde bude potřeba
- KOSABI a Lanius – koordinace zpracování titulů v budoucnu
- Spolupráce s dalšími knihovnami a informačními institucemi
- Spolupráce se společností Anopress, event. navázání spolupráce s dalšími institucemi
(nakladatelé, vydavatelé aj.)
|
38
|
- Doladit převod z některých systémů do standardního UNIMARCu a báze ANL
- Harmonizace popisu článků v rámci KOSABI se soubory autorit zejména v
oblasti věcného zpracování (předmětová hesla, předmětové kategorie,
metoda konspektu)
- Konverze UNIMARC-MARC 21, pravidla pro popis článků vzhledem k tomuto
formátu
- Testovat a event. postupně aplikovat linku zpracování bibliografických
záznamů z plných textů (TTDE,
automatická či poloautomatická extrakce a indexace dat) v rámci KOSABI
- Spolupráce s projektem Webarchiv?
|
39
|
- I. Zpracování sborníků a nepravých periodik (zatím nedostupných v
elektronické formě) ručně v tradičních systémech
- II. Zpracování deníků a časopisů a dalších seriálů (v elektronické
formě, na www) v rámci linky zpracování bibliografických záznamů z
plných textů se spolehlivým napojením na plné texty automaticky či
poloautomaticky
- III. Zpracování plných textů volně přístupných na www na základě automatického
sběru dat - pouze vytypované spolehlivé seriálové zdroje - za spolupráce
s Webarchivem?
- Předpoklad: dodržování zásad výběru článků a titulů
- Cíl (II.+III.): automatické či poloautomatické zpracování bibliografických
záznamů z plných textů - pouze výběr titulů ke zpracování a korekce dat
|
40
|
- Báze ANL a ANAL (Olomouc) zpřístupněna v JIB jako zdroj
- Báze ANL FULL zpřístupněna v JIB jako odkaz
- Plné texty báze ANL FULL a přes bázi ANL přístupné v JIB pro externí
uživatele na 7 dnů
- Báze ANL (jejíž část vzniká v lince TTDE) je vydávána jako řada ČNB
Články v českých novinách, časopisech a sbornících
|
41
|
- Řada členů KOSABI přístup k plným textům v rámci konzorcia Anopress -
báze TamTam (původně založeného v roce 2000 a iniciováno v rámci
řešených projektů)
- Září 2002 – multilicenční zpřístupnění databází TamTam a ČTK v rámci VISK 8
- Analogicky vyplývá: v budoucnu podobné zpřístupnění báze ANL FULL a
licence resp. multilicence pro přístup do báze TamTam pro linku
zpracování bibliografických záznamů z plných textů
- Předpoklad: dohoda mezi zainteresovanými subjekty, legislativně právní
otázky
|
42
|
- Respekt k tradici, domácímu terénu i světovým trendům, transparentní
řešení a schopnost kompromisů
- Transformace systému po stránce koncepční, technické i technologické
- Personální zázemí (silné redukce oddělení analytického zpracování v posledních letech)
- Finanční zázemí do r. 2004 (dotace MKČR), návazný projekt?
- GILS – služba a nástroj pro řízení informačních zdrojů z oblasti státní
správy: inspirace pro KOSABI a systém knihoven v ČR?
|
43
|
|