|obsah |index autorů |  | index názvů |  | index témat | | archiv |

 


 

Knihovna

2010, ročník 21, číslo 2,  s.  5-20


 

JPEG2000 – Aneb nemyslete si, že vás mine!

PhDr. Bedřich Vychodil / Odbor digitální ochrany NK ČR / doktorand UISK FF UK / bedrich.vychodil@nkp.cz

 

Resumé:

Autor představuje relativně nový formát JPEG2000, který je v současnosti velmi slibnou alternativou pro uchovávání a distribuci rastrových reprezentací analogových dokumentů vznikajících při digitalizaci sbírek v paměťových institucích. Představuje a vizuálně demonstruje využití vybraných částí specifikace, které jsou z pohledu paměťových institucí relevantní.Předkládá též návrh reálného workflow pro Národní knihovnu České republiky za použití základní specifikace tohoto formátu. Na závěr je uvedeno obecné shrnutí výhod a nevýhod formátu JPEG2000.

Klíčová slova: JPEG2000 – JP2 – grafický formát–komprese–progresivnípřenos–archivníkopie – workflow.

Summary:

The author presents a relatively new JPEG2000 format, which, in terms of memory institutions, is currently a very promising alternative for storing and distributing digital representations of analog documents produced by digitization. He visually demonstrates the use of specially selected parts of JPEG2000 specification, which are relevant from the perspective of memory institutions.Additionally, it sets out a proposal for the real workflow of The National Library of the CzechRepublic, using the basic specification of this format. The paper concludes a general summary of the advantages and disadvantages of JPEG2000 format.

Keywords: JPEG2000 – JP2 – graphic format – compression – progressive transmission – master copy – workflow.

 

Úvod

Cílem tohoto článku je představení relativně nového grafického formátu JPEG2000 odborné knihovnické veřejnosti, a to nejen z technického aspektu samotného formátu, ale především z hlediska využití formátu JPEG2000 v prostředí paměťových institucí, jako jsou například knihovny nebo archivy, a uvedení s tím souvisejících témat.

Problematika grafického formátu JPEG2000 je značně rozsáhlá a nelze ji snadno pochopit bez hlubšího studia. Právě proto může tento nový přístup k dlouhodobé archivaci a zpřístupnění kulturního dědictví vyvolávat dojem zbytečné komplikovanosti a nadbytečnosti.

Představení relevantních částí specifikace JPEG2000 s praktickými ukázkami má napomoci k pochopení a objasnění často se vyskytujících mylných představ a očekávání a především demonstrativně představit možnosti a přednosti tohoto formátu.

V článku je představena nová koncepce využití formátu JPEG2000 v prostředí Národní knihovny České republiky, která zvolila tento formát jako formát pro účely digitální archivace i zpřístupnění v rámci projektu Národní digitální knihovna.

Komprese

Celosvětový nárůst objemu digitálních informací se nutně musí odrážet nejen ve způsobu správy dat, ale především ve způsobu jejich dlouhodobého uchování.

Pro představu, o jakém nárůstu dat je řeč, je níže uvedena aktuální predikce nárůstu objemu informací a úložného prostoru, viz Obr. 1.

Růst objemu informací a úložného prostoru

Obr. 11 . Růst objemu informací a úložného prostoru (Growth of Information and Storage Trends). Zdroj: IDC Digital Universe White Paper, sponzorováno EMC, květen 2009. Umístění na šířku stránky

Praxe ukazuje vzrůstající nepoměr mezi dostupnou kapacitou úložišť a celkovým objemem vznikajících dat. Tento trend jasně ukazuje na vznikající problém, kterému čelíme a budeme čelit i v budoucnu. Z tohoto důvodu je nutné přistoupit k cílené selekci dat. Je třeba rozlišit data, která chceme dlouhodobě ukládat, a data, která necháme navždy zmizet. Další možností, jak cíleně redukovat objem vzniklých digitálních dat, je využití vhodné komprese, což je strategie, které se zde budeme věnovat.

V případě paměťových institucí, v nichž vznikají převážně rastrové reprezentace analogových dokumentů v enormních datových objemech, je zapotřebí využívat vhodné komprese, které nám dokáží zajistit požadovanou kvalitu výsledné reprezentace a zároveň generovat technicky zvládnutelné objemy dat.

Porovnání kompresních poměrů u běžně používaných formátů a u JPEG2000

Obr. 2. Porovnání kompresních poměrů u běžně používaných formátů a u JPEG2000.

Paleta grafických formátů či tzv. kontejnerů je dosti široká, ovšem pro účely paměťových institucí vyhovuje pouze malá skupina formátů. Jen pro ilustraci uveďme ty nejznámější: TIFF, PNG, JPEG, PDF, DjVu. Kvůli dramatickému vývoji v této oblasti grafické formáty rychle zastarávají, a proto vznikají nové metody komprese, jež využívají nových kompresních algoritmů.

JPEG2000 jako nástupce JPEG

Za vznikem formátu JPEG20002 stojí konsorcium nazvané Joint Photographic Experts Group3, které již v roce 1986 stálo u zrodu základní specifikace formátu JPEG (JFIF)4. Formát JPEG se v roce 1992 stal mezinárodním standardem a byl zaměřen na co možná nejúčinnější ztrátovou kompresi, méně však na výslednou kvalitu obrazu. Od začátku byl koncipován jako formát pro ukládání rastrových obrázků spojité grafiky,např. fotografie. Po uvedení unifikované podoby se stal díky svým přednostem oblíbeným formátem. V současnosti je formát JPEG nejvyužívanějším formátem v prostředí internetové sítě.

Důvody pro vznik nové generace grafických formátů vyvstaly nejen kvůli trendu narůstajícího množství dat a s tím spjatému požadavku výkonnějších kompresních metod, ale především vzhledem k implementaci nových technologií v oblasti správy rastrových obrázků (zpracování, ukládání a v neposlední řadě zpřístupnění). To vše nový multi-formát JPEG2000 implementuje ve své rozsáhlé specifikaci5.

První podmínkou pro vznik úspěšného grafického formátu, který by mohl nahradit formát JPEG, byla neproprietárnost formátu. Druhou podmínkou bylo to, aby vzniklý formát byl ze své podstaty mezinárodním standardem6 stejně jako formát JPEG.

Dalším cílem byla implementace jak ztrátové7, tak bezeztrátové komprese8 za použití konzistentního kompresního algoritmu9. S tím se pojí snaha o eliminaci nechtěných vizuálních artefaktů vznikajících při ztrátové kompresi, viz Obr. 3. Zatímco ztrátová komprese je důležitá z pohledu zpřístupnění, tedy pro vytváření uživatelských kopií10 (z důvodu redukce velikosti souborů), bezeztrátová komprese je důležitá především pro ukládání archivních kopií11 dokumentů.

Dalším důvodem pro vytvoření nového formátu bylo odstranění technických omezení stávajících formátů. V první řadě se jednalo o zrušení maximální velikosti komprimovaného/zobrazovaného obrázku a o podporu vyšší bitové hloubky na úroveň 48 bitů RGB s podporou průhlednosti. V neposlední řadě bylo důležité zvýšit odolnost formátu vůči vzniku tzv. bit rotu12 a odolnost vůči přenosovým chybám.13

Stejně jako u ostatních formátů je specifikace JPEG2000 složena z několika částí. Konkrétně se jedná o čtrnáct částí, přičemž sedmá část byla v průběhu vývoje vyřazena. Vývoj specifikace stále pokračuje, a proto se v budoucnu mohou objevit další dodatečné části. Uvést celou specifikaci formátu JPEG2000 by bylo nad rámec tohoto článku. Níže jsou uvedeny pouze čtyři části specifikace, které jsou relevantní z pohledu paměťových institucí:

1. část definuje základní jádro kódování vlnkové transformace;

2. část rozšiřuje specifikaci1.části;

6. část definuje specifikaci pro kompresi složených dokumentů;

9. část definuje specifikaci pro Interaktivní klient-server protokol.

V následujícím textu budou tyto čtyři hlavní části blíže představeny.

Porovnání výkonnosti použitého kompresního algoritmu při zachování stejného kompresního poměru.

Obr. 3 Porovnání výkonnosti použitého kompresního algoritmu při zachování stejného kompresního poměru. Za využití zdroje: UCL Communications and Remote Sensing Laboratory, www.tele.ucl.ac.be. Umístění na šířku stránky

SpecifikaceformátuJPEG2000

1. část – Definice základního jádra kódování vlnkové transformace

Přípona souboru: .jp2

Ve specifikaci formátu JPEG2000 je definován základní algoritmus využívající diskrétní vlnkovou transformaci 14, a to jak pro ztrátovou (CDF 9/7), tak pro bezeztrátovou nebo též ztrátovou (CDF 5/3) transformaci. Tato specifikace se stala mezinárodním standardem a je kompletně otevřená pro veškeré účely a oproštěná od licencí a poplatků.

Pro samotnou diskrétní vlnkovou transformaci se vžil termín JPEG2000, stejně tak pro formát samotný, jako přípona souboru se užívá zkratka JP2.

Strukturu souboru JP2 v podstatě tvoří postupná sekvence tzv. boxů. Základní uspořádání boxů je povinné, zbylá část boxů je volitelná, tedy jejich využití záleží pouze na potřebách a způsobu vygenerování souboru. Obr. 4. ukazuje pouze konceptuální strukturu souboru JP2 s povinnými boxy. "JP2 Signature box" by vždy měl být prvním boxem v souboru, následovat by měl "Profilebox"."JP2Headerbox"je tzv."Superbox",kterýmůže obsahovat další boxy, jako například "Image Header box" a "Color Specification box". "Contiguous Code-stream box" by se nikdy neměl objevit před "JP2 Header box". Jakékoli další nepovinné boxy mohou být umístěny v JP2 souboru v libovolném pořadí, nicméně všechna data musí být uložena v těchto boxech a žádná jiná data zde být uložena nesmějí.

JP2 Signature box má pevnou délku 12 bytů. Identifikuje, že jde o JP2 soubor.

Profilebox obsahuje značku (Brand) a list kompatibility (Compatibility list). Obě pole jsou uložena ve 4 bytech v kódování ASCII.

JP2 Header box obsahuje hlavičku obrázku (Image Header) a alespoň jednu barevnou specifikace(ColorSpecification).

Image Header box má pevnou délku 24 bytů a obsahuje obecné informace o obrázku (výška, šířka a počet komponent).

Color Specificationbox specifikujebarevnýprostor(Color space) pro všechny dekomprimované komponenty obrázku.

Contiguous Code-stream box obsahuje validní a kompletní JPEG2000 bitstream.

Základní struktura souboru JP2

Obr. 4. Základní struktura souboru JP2.

Dvourozměrná DWT transformace ve třech úrovních

Obr. 515. Dvourozměrná DWT transformace ve třech úrovních. Způsob, jakým je JPEG2000 bitstream rozložen pomocí subpásem v "Contiguous Code-stream box".

2. část – Rozšíření specifikace1.části

Přípona souboru: .jpx, .jpf

Druhá část definuje efektivnější kompresi za pomoci komplexnějšího kompresního algoritmu a využití dalších kompresních algoritmů (MMR, JPEG, JBIG-1, JBIG-2, JPEG-LS aj.). Dále implementuje animace, rozšiřuje barevné mody 16, barevné profilyICC 17 a způsoby ochrany duševního vlastnictví a definuje využívání tzv. zájmových oblastí 18.

Tato rozšíření jsou zaváděna pomalu, protože jejich největší překážkou je licencování. Proto konsorcium Joint Photographic Experts Group vytváří konstantní tlak na držitele práv k těmto rozšířením, aby bylo možné jejich nejdůležitější část začlenit do 1. části specifikaceJPEG2000, která je neproprietární.

V současné době se intenzivně pracuje na "přesunutí" specifikace barevných modů a barevných profilů 19 z druhé části specifikace do části první právě z důvodu odstranění licenčních vazeb. Nejenže je tento krok zcela zásadní pro potřeby paměťových institucí, ale také by znamenal posun k plnohodnotnému využívání formátu JPEG2000 jako archivního formátu a odklon od formátu TIFF 20.

6. část – Specifikace pro kompresi složených dokumentů

Přípona souboru: .jpm

Šestá část specifikace je vhodná pro vícestránkové dokumenty a dokumenty obsahující text a nespojitou grafiku (perokresbu, vektorovou grafiku), vyskytující se společně se spojitou grafikou(např.fotografie). Tato technika není ničím novýma byla v minulosti již úspěšně využita například u grafického formátu DjVu 21 nebo u dnes hojně rozšířeného formátu PDF 22.

Tato specifikace obsahuje inteligentní zónovací algoritmus, který umožňuje rozdělit obrazový dokument podle obsahu do tří vrstev. První vrstva (popředí) 23 obsahuje informaci o barvě ploch masky textu a nespojité grafiky.Druhá vrstva(maska) 24 obsahuje informace o hranách, jde tedy o bitonální 25 reprezentaci textu a nespojité grafiky. Poslední vrstva (pozadí) 26 obsahuje informace o spojité grafice.

Znázornění principu komprese do formátu JPM.

Obr. 6. Znázornění principu komprese do formátu JPM. Výsledný dokument je 40x menší než originální dokument bez komprese, při zachování čitelnosti textu a bez vizuálně rušivých artefaktů.

Na vrstvy popředí a pozadí je přednostně využíván algoritmus definovaný v první části specifikaceJPEG2000, tedy algoritmus využívající diskrétní vlnkovou transformaci. Je ovšem možné využít i jiné kompresní algoritmy, jako např. diskrétní kosinovou transformaci využívanou ve formátu JPEG. Na komprimaci vrstvy maska je využíván bezeztrátový algoritmus JB1, JB2 nebo Fax G4, který umožňuje zachování vysoké čitelnosti textu a ostrých hran u nespojité grafiky.

Technika komprese složených dokumentů umožňuje dosahovat vysokých kompresních poměrů27 , a to při zachování velmi dobré čitelnosti textu a ostrých přechodů (detailů) i u nespojité grafiky,vizObr.7.

Příklad komprese pomocí JPEG2000/část 6. Komprese složených dokumentů

Obr. 7. Příklad komprese pomocí JPEG2000/část 6. Komprese složených dokumentů Compound image fileformat JPM /MRC/. Za využití zdroje: http://dvd-hq.info.

9. část – Specifikace pro interaktivní protokol klient-server

Distribuce obrazových dat ve vysokém rozlišení a ve vyšší bitové hloubce vyžaduje vysokou prostupnost sítě a je také značně hardwarově náročná na přenosná zařízení.

Z těchto důvodů byl vyvinut způsob, jak přenášet dílčí (vyžádané) části bitstreamu souborů JP2 po internetu nad protokolem http. Tento způsob se nazývá JPIP a jedná se o tzv. streamování dat neboli postupné načítání obsahu.

Pro takovýto způsob progresivního přenosu je nutná podpora jak na straně poskytovatele (image server), tak na straně příjemce (podpora prohlížeče, zásuvný modul 28). Formát JPEG2000 má pro tento způsob přenosu navrženu vnitřní architekturu.

Dekomprese a progresivní přenos dat

Formát JPEG2000 umožňuje nové způsoby dekomprese a zobrazování bitstreamu. Vnitřní tzv. boxová struktura a strukturované rozložení bitstreamu do paketů umožňují využívat formát JPEG2000 zcela odlišným způsobem, než je tomu u běžně používaných formátů. Díky možnosti měnit pořadí paketů je možné zobrazovat přednostně různé části bitstreamu. Například je možné zobrazit pouze náhled, různá rozlišení, různé kvality, různé předem navolené oblasti zájmu nebo pouze zobrazit obrázek ve stupních šedi, a to vše bez jakéhokoli přepočtu zdrojového obrázku a bez nutnosti celkového načtení bitstreamu do cílového zařízení, viz Obr. 8. Tato technologie (progresivní přenos) podporuje tzv. metodu přenesení/zobrazení obsahu na vyžádání (on-demand, též on-the-fly).

Zmíněná technologie je využívána převážně pro zefektivnění přenosu dat, urychlení vyhledávání, což vede ke snížení nároků na přenosové kapacity. Umožňuje také zobrazování nadměrně velkých (dimensionální rozměry, velká rozlišení, velká barevná hloubka atd.) obrazových souborů, např. map či medicínských snímků.

Možnosti progresivního přenosu při využití Image serveru a formátu JPEG2000.

Obr. 8. Možnosti progresivního přenosu při využití Image serveru a formátu JPEG2000.

Detailní rozpis možností zobrazování

Podle rozlišení /By Resolution/ – bitsream je přednostně načítán od nejmenšího rozlišení (Thumbnail) až po největší fyzické rozlišení uloženého obrázku (pokud není některá z vrstev záměrně uzamčena), viz Obr. 9. Počet vrstev je definován již při generování souboru JP2 a je možné jej pevně nastavit (běžně se užívá 5 až 6 vrstev) nebo zvolit automatické vygenerování počtu vrstev v závislosti na velikosti zpracovaného obrázku. Obecně platí, že čím větší je obrázek, tím více vrstev se generuje. Ve specifikaci je tento postup načítání (Progress order) označován zkratkou RPCL 29 nebo RLCP 30 (Resolution progressive).

Podle kvality /By Quality/ – bitstream je přednostně načítán od nejnižší kvality až po největší fyzickou kvalitu uloženého obrázku (pokud není některá z vrstev záměrně uzamčena), viz Obr. 10. Počet vrstev je definovánjižpřigenerovánísouboruJP2.Počet vrstev je možné pevně nastavit (běžně se užívá 1 až 12 vrstev). Ve specifikaci je tento postup označován zkratkou LRCP 31 (Accuracy progressive).

Podle umístění /By Position/ – tento způsob představuje standardní načítání bitstreamu od začátku do konce bez jakýchkoli prioritních nastavení. Ve specifikaci je tento postup načítání označován zkratkou PCRL 32 (Spatially progressive).

Podle zájmových oblastí /By Region of Interest/ – zájmové oblasti jsou od ostatních částí obrázku odlišeny prioritním umístěním v bitstreamu, případně jsou ve vyšším rozlišení. Z toho důvodu se načítají jako první. Zájmových oblastí může být v jednom JP2 souboru maximálně 16 a mohou být definovány jak obdélníkovým, tak kruhovým ohraničením libovolné velikosti. Ve specifikaci je tento postup načítání označován zkratkou CPRL 33 (Spatially progressive).

Přednostní zobrazení odstínů šedi – tohoto zobrazení je docíleno načtením pouze těch dat, které tvoří daný obrázek v odstínech šedi, tedy načtením pouze komponenty jasu (Y – Luminance). Teprve po tomto načtení se začnou načítat barevné složky obrázku, tzv. modrá chrominanční komponenta Cb a červená chrominanční komponenta Cr. Ve specifikaci je tento postup načítání označován zkratkou CPRL 34 (Spatially progressive).

Zobrazování podle rozlišení /By Resolution/

Simulace načítání obsahu obrázku při využití funkce zobrazovaní podle rozlišení

Obr. 9. Simulace načítání obsahu obrázku při využití funkce zobrazovaní podle rozlišení.

Zobrazování podle kvality /By Quality/

Simulace načítání obsahu obrázku při využití funkce zobrazování podle kvality

Obr. 10. Simulace načítání obsahu obrázku při využití funkce zobrazování podle kvality.

Použití formátu JPEG2000 v Národní knihovně České republiky

V současnosti se v Národní knihovně České republiky připravuje nová koncepce dlouhodobé ochrany a zpřístupnění národního kulturního dědictví za využití formátu JPEG2000. Prvotním podnětem pro aplikaci formátu JPEG2000 byla masová digitalizace českého kulturního dědictví v rámci projektu NDK 35. Odbor digitální ochrany Národní knihovny České republiky provedl analýzu projektů masové digitalizace v zahraničí, na jejímž základě bylo zjištěno, že nejužívanějším řešením je využití formátu TIFF jako archivního formátu a formátu JPEG jako formátu pro zpřístupnění. Toto řešení má mnoho nevýhod. Především jde o nutnost koordinace a správy několika kopií v různých grafických formátech a rozlišeních, což je z technického hlediska poměrně náročné. Dalším problémem je skutečnost, že formáty JPEG a TIFF, jak vyplývá z mnoha studií 36, jsou značně náchylné na poškození způsobené bit rotem. V neposlední řadě je potřeba podotknout, že formát TIFF je formátem proprietárním 37. Hlavním důvodem odklonu od formátu TIFF je ovšem narůstající míra digitalizace, s níž je spojen požadavek na vysokou kapacitu úložišť digitálních repozitářů. Formát TIFF nadále využívají a implementují většinou ty paměťové instituce, které digitalizují v menším měřítku, tedy nepotřebují spravovat velké objemy dat. Knihovny, které provádějí masovou digitalizaci a nedisponují přitom většími finančními prostředky,sevsoučasnédoběpřiklánějíkimplementaciformátu JPEG2000. Pro příklad uveďme ty nejznámější: Královská knihovna v Nizozemsku, Kongresová knihovna v USA, Britská knihovna ve Velké Británii, Národní knihovna na Novém Zélandu aj.

Díky implementaci formátu JPEG2000 výše uvedené problémy (proprietárnost, vznik artefaktů, malá odolnost formátu, aj.) odpadají. Pouze formát JPEG2000 může být využit jak pro účely dlouhodobé archivace, tak pro účely zpřístupnění, konkrétně pomocí tzv. zpřístupňovacích kopií (PMC – Production Master Copy), viz Obr. 11.

Digitalizační workflow pro prostředí Národní knihovny České republiky

Obr. 11 Digitalizační workflow pro prostředí Národní knihovny České republiky.

Ve výše uvedeném workflow, které bude využito v rámci projektu NDK, je sice formát TIFF také využit, ale pouze ve dvou případech. Poprvé jako formát pro dočasnou kopii vytvořenou při skenování, která se po úpravách (narovnání, ořez) převádí na bezeztrátový a ztrátový soubor JP2. Poté co je provedena automatická kontrola kvality obsahu výsledných souborů JP2, se dočasný soubor ve formátu TIFF vymaže. Bezeztrátový JP2 soubor je spolu s metadaty uložen do důvěryhodného národního digitálního repozitáře (tzv. LTP-system38 ). Ztrátový JP2 soubor je spolu s metadaty je uložen v aplikaci Kramerius 4, která slouží k zpřístupnění dat. V druhém případě je formát TIFF využit pro archivaci naskenované kalibrační tabulky (Color targets). Toto využití je volitelný článek v procesu digitalizace a bude aplikováno pouze pro rukopisy, popřípadě mapy. Je možné podotknout, že pro tento účel je též možné využít formát JPEG2000.

Ze zpřístupňovací kopie se na vyžádání koncového uživatele prostřednictvím image serveru generují uživatelské kopie (UC – User Copy) ve formátu JPEG. Tyto uživatelské kopie jsou určeny pouze k zasílání vyžádaných obrazových dat po internetové síti koncovému uživateli. Jedná se tedy o jakési dočasné kopie, které budou archivovány jen po určitou dobu ve vyrovnávací paměti pro případné opakované zaslání koncovým uživatelům bez nutnosti generování totožné uživatelské kopie v krátkém časovém úseku.

Využívání formátu TIFF v procesu masové digitalizace vychází z ryze praktických důvodů. Jedná se o základní formát podporovaný všemi zařízeními, který lze snadno upravit ve všech dostupných grafických editorech. Moderní skenovací zařízení sice podporují možnost skenovat přímo do formátu JPEG2000, ale s řadou problémů. Jde jednak o problémy na úrovni generování souborů JP2, jednak o problémy se samotnou editací souborů. V neposlední řadě je zde mnoho problémů s editací metadat. Praxe ukázala, že formát TIFF je stále vhodným mezičlánkem pro generování validních JP2 souborů.

Při generování souborů JP2 je potřeba zvolit mnoho parametrů, které ovlivňují způsob následné dekomprese, popřípadě progresivní přenos dat. Tento fakt je třeba mít stále na paměti a specifikaci formátu JPEG2000 pečlivě navrhnout v závislosti na požadavcích konkrétní instituce a jejích aktivit. Pokročilá architektura formátu JPEG2000 umožňuje migrovat původně vygenerovaný soubor JP2 do nového souboru JP2 za použití nové specifikace, a to bez jakékoli ztráty(obrazové kvality nebo metadat). Návrh specifikace formátu JPEG2000 pro kontext konkrétní digitalizace je velmi rozsáhlé téma a není předmětem tohoto článku.

Závěr

Výhody implementace JPEG2000 jsou prokazatelné v kontextu mezinárodních aktivit a předurčují formát JPEG2000 k masovému využívání (nejen) v paměťových institucích. Implementace tohoto multi-formátu však není jednoduchá a vyžaduje hlubší studium celé problematiky.

Postupným rozšiřováním implementace tohoto formátu se ustálí dnes do jisté míry nestandardní postupy a vyplní se mezery na trhu s adekvátními softwarovými nástroji. Současné nástroje v naprosté většině implementují vždy jen malou část z celé specifikace formátu JPEG2000. Tato nekonzistentnost pak jen ztěžuje plnohodnotné nasazení v praxi.

I přes veškerá úskalí, která s sebou tento formát přináší, je v současné době JPEG2000 nejvhodnějším kandidátem pro účely masové digitalizace. Na závěr jsou uvedeny klady a zápory nasazení tohoto formátu:

Klady:

Konzistentní algoritmus jak pro ztrátovou, tak pro bezeztrátovou kompresi.

Kompresní algoritmus založený na vlnkové transformaci.

Výkonnější kompresní algoritmus (při ztrátové kompresi o 20-30 % výkonnější oproti JPEG, poměr bezztrátové komprese je 1/2 oproti nekomprimovanému souboru).

Velmi dobré výsledky při poměru nižším, než je 0.25 bit/pixel.

Dobré výsledky při komprimování tzv. počítačově generované grafiky s ostrými přechody.

Unifikovaný systém dekomprese.

Progresivní přenos.

Rozdělení obrazu do bloků, které usnadňují a urychlují přístup k datům.

Podpora tzv. "složených dokumentů" obsahujících text a grafiku, při současném dosažení velkých kompresních poměrů.

Podpora "zájmových oblastí".

Podpora obrázků větších než 64000 x 64000 pixelů.

Podpora vícebarevných modů.

Rozšířené možnosti uložení metadat (uložených přímo v souboru JP2).

Vysoká odolnost vůči bit rotu a chybám vzniklých při přenosu.

Zápory:

Nutnost zásuvného modulu (Plug-In) pro zobrazení na straně koncového uživatele.

Nutnost implementace image serveru do zpřístupňovací aplikace na str. distributora.

Nedostatek kvalitních softwarových nástrojů.

Nekonzistentnost implementace algoritmů.

Problémy s metadaty při migraci.

Počáteční skepse producentů a uživatelů.

Slovník pojmů

Bezeztrátová komprese (Lossless Compression) je matematicky bezztrátová komprese, při níž zkomprimovaný obraz po dekompresi má shodný bitstream jako původní bitstream.

Ztrátová komprese (Lossy Compression) je při správném nastavení fyziologicky vnímána jako vizuálně bezeztrátová. Při překročení doporučených limitů dochází k výskytu tzv. artefaktů (zkreslení). Komprese je schopná efektivně snížit objem dat.

Archivní kopie, MC (Master Copy, Archival Copy, Archival Master) je rastrový obraz vysoké kvality, v zásadě za použití bezeztrátové komprese. Tato kopie může být použita v případě ztráty originálu jako náhrada (Surrogate Copy).

Zpřístupňovací kopie, PMC (Production Master, Copy Access Master) je autentická kopie MC (lze aplikovat ztrátovou kompresi), která je použita jako náhrada za archivní kopii pro účely uživatelského zpřístupnění (day-to-day use kopie). Z této kopie se vytvářejí veškeré deriváty pro koncového uživatele (on-the-fly).Tato kopie je využívána z bezpečnostních důvodů, k oddělení archivní části a uživatelské části.

Uživatelská kopie, UC (User Copy, Service Copy) – vytváří se přímo při procesu digitalizace nebo na vyžádání koncového uživatele (on-demand) z PMC, v některých případech přímo z MC. Většinou se vyznačuje menší kvalitou obrazu než MC (snížením rozlišení, bitové hloubky, ztrátovou kompresí).

 


 

Poznámky:

 

1 Petabyte (čti "petabajt”), někdy též petabajt, značí se PB, je buď 1015 (= 1 000 000 000 000 000) bytů (pro dekadický systém) nebo 250 (= 1 125 899 906 842 624) bytů, pokud použijeme (častější) binární soustavu.

2 JPEG2000 (čteno "džeipeg dvatisíce”). Výslovnost vychází z anglické výslovnosti.

3 Členy tohoto konsorcia Joint Photographic Experts Group jsou zástupci významných akademických pracovišť i komerčních subjektů (Adobe, Canon, Ericsson, Kodak, Ricoh, Samsung aj.) http://www.jpeg.org/.

4 JPEG (čteno "džeipeg”). Výslovnost vychází z anglické výslovnosti. Původním názvem typu souboru je JFIF (JPEG File Interchange Format). Ustálená zkratka JPEG pro tento typ souboru je zkratka názvu konsorcia Joint Photographic Experts Group. JPEG komprese je využívána v mnoha grafických formátech(JPEG/Exif u fotoaparátů ,JPEG/JFIF pro ukládání a přenos fotografických obrázků atd.), které se v praxi nerozlišují a nazývají se jednotně JPEG.

5 Mezinárodní standard pro JPEG2000 ISO/IEC 15444-(1-14).

6 Mezinárodní standard pro JPEG2000 ISO/IEC 15444-(1-14).

7 V angl. lit. termínu ztrátová komprese odpovídá termín Lossy Compression.

8 V angl. lit. termínu bezeztrátová komprese odpovídá termín Lossless Compression.

9 U formátu JPEG je většina ze 44 režimů standardu dekodérů nepodporována dekodéry.

10 V angl. lit. termínu uživatelská kopie odpovídá termín UC - User Copy, která slouží k zpřístupnění.

11 V angl. lit. termínu archivní kopie odpovídají termíny MC - Master Copy, Archival Copy, Archival Master Copy, která při ztrátě originálu může sloužit jako plnohodnotná náhrada tzv. Surrogate Copy.

12 B9it rot neboli postupný rozpad dat na bitové úrovni (způsobený poškozením např. nosiče).

13 Paolo Buonora, Franco Liberati, A Format for Digital Preservation of Images, A Study on JPEG 2000 File Robustness.

14 V angl. lit. termínu diskrétní vlnková transformace odpovídá termín DWT - Discrete Wavelet Transform

15 V angl. lit. termínu subpásmo odpovídá termín Subband. Dvourozměrná (2D) transformace je taková, která se používá pro analýzu a syntézu dvourozměrných signálů, jakými jsou digitální obrazy. Základem 2D DWT je jednorozměrná transformace aplikovaná zvlášť na řádky a zvlášť na sloupce obrazu. Nejprve se tedy aplikuje dvojice filtrůh0;h1 na každý řádek dvourozměrného obrazu zvlášťa provede se nezbytné odstranění lichých koeficientů. Stejná dvojice filtrů se následně aplikuje na výsledek předchozí transformace, tentokrát ale po sloupcích. Z výsledku jsou rovněž odstraněny liché koeficienty, v tomto případě liché řádky. Výsledkem jsou čtyři stejně velká subpásma - obrázky mající dohromady stejnou plochu jako originální obraz. Subpásmo v levé horní části dekompozice může být dále dekomponováno. Obr. 7. ukazuje značení jednotlivých subpásem a naznačuje postup dekompozice. V první úrovni vznikla čtyři subpásma LL1, HL1, LH1 a HH1, přičemž LL1 bylo dále dekomponováno do subpásem LL2, HL2, LH2 a HH2. Nakonec bylo dekomponováno subpásmo LL3. Celkem jsou zobrazeny tři úrovně dekompozice. Převzato a modifikováno z: Implementace JPEG2000 komprese na GPU ,Jiří Matela, Brno, 2009. 16 V současné době je v jednání možnost vyčlenit funkci rozšířených barevných modů z 2. části specifikace a přesunout ji do1.části, která spadá pod mezinárodní standard. Důvody pro tyto iniciativy vychází z ryze praktických důvodů, které se objevily při implementaci JPEG2000 v paměťových institucích, jež chtějí pro svá obrazová data využívat i rozšířených barevných modů. To v současnosti znemožňuje uplatňování licencí.

17 ICC (International Color Consortium). Mezinárodní konsorcium, které bylo založeno v roce 1993. Hlavním cílem tohoto konsorcia je vytvořit jednotný a přenosný systém pro správu barev mezi zobrazovacími zařízeními, tiskovými zařízeními a operačními systémy, kde systém správy barev je prováděn pomocí tzv. ICC profilů.

19 Osobní konzultace s Robertem Buckleym (výzkumník ve společnosti Xerox Innovation Group a předseda komise zabývající se výzkumem JPEG2000/6. část).

20 TIFF (Tag Image File Format) je formát pro ukládání rastrové grafiky. Formát TIFF tvoří neoficiální standard vytvořený v roce 1986 společností Aldus jako datový kontejner pro skenovací zařízení. Dnes je licence vlastněna firmou Adobe. I přesto, že licence není uplatněna, jedná se o proprietární formát.

21 GrafickýformátDjVubylvroce1996navrženýspolečnostíAT&T pro ukládání a archivaci rastrových obrazových dat v podobě skenovaných tištěných dokumentů, které mohou být v DjVu souborech komprimovány buď do jedné vrstvy (Photo Quality) za pomoci diskrétní vlnkové transformace nebo za použití tzv. MRC (Mixed raster content), kde jsou obrazová data ukládána do tří vrstev a komprimována jak za pomoci diskrétní vlnkové transformace, tak JB1 nebo JB2 komprese. Jedná se o proprietární formát.

22 PDF (zkratka anglického názvu Portable Document Format – Přenosný formát dokumentů). Jedná se o proprietární formát.

23 V angl. lit. termínu popředí odpovídá termín Foreground.

24 V angl. lit. termínu maska odpovídá termín Mask.

25 V angl. lit. termínu bitonální odpovídá termín Bilevel.

26 V angl. lit. termínu pozadí odpovídá termín Background.

27 Podle testů  firmy LuraTech je možné dosahovat kompresních poměrů od 1:150 až do1:5000, přičemž výsledný poměr je přímo úměrný obsahu dokumentu.

28 V angl. lit. termínu zásuvný modul odpovídá termín Plug-In.

29 RPCL (Resolution-Position-Component-Layer).

30 RLCP (Resolution-Layer-Component-Position).

31 LRCP (Layer-Resolution-Component-Position).

32 PCRL (Position-Component-Resolution-Layer).

33 CPRL (Component-Position-Resolution-Layer).

34 CPRL (Component-Position-Resolution-Layer).

35 NDK (Národní digitální knihovna), http://www.ndk.cz/narodni-dk

36 Např. Paolo Buonora, Franco Liberati, A Format for Digital Preservation of Images, A Study on JPEG 2000 File Robustness.

37 Licenční práva k formátu TIFF v současné době vlastní firmaAdobe.Neuplatňujesicelicencena tento formát, ale je to možné v budoucnosti. Tento formát není mezinárodním standardem.

38 LTP-System (Long Term Preservation System).

 


 

 

Literatura:

SCHELKENS, Peter; SKODRAS, Athanassios; TOURADJ, Ebrahimi. The JPEG 2000. Suite : Wiley Publishing, 2009. 544 s. ISBN 0470721472.

The JPEG Commitee home page [online]. c2010 [cit. 2010-10-14]. Dostupné z WWW: <http://www.jpeg.org/>.

BUONORA, Paolo; LIBERATI, Franco. A Format for Digital Preservation of Images : A Study on JPEG 2000 File Robustness [online]. c2008 [cit. 2010-10-14]. Dostupné z WWW: <http://www.dlib.org/dlib/july08/buonora/07buonora.html/>.

MAJID, Rabbani. The JPEG2000 Still-Image Compression Standard. Eastman Kodak Reaserch Laboratories, Diego Santa Cruz, Swiss Federal Institute od Technology, Lausanne (EPFL).

DOHM, Digitisation of Heritage Materials, [online]. c2009 [cit. 2010-10-19]. National Library of Australia. Dostupné z WWW: <http://www.nla.gov.au/preserve/dohm/material/DOHM.pdf>.

MACDONALD, Lindsay (Ed.). Digital Heritage : Applying Digital Imaging to Cultural Heritage. 1. edice. Elsevier, 2006. ISBN 978-0-75-066183-6, ISBN 0-75-066183-6.

 

 

CITACE:

Vychodil, Bedřich. JPEG2000 – Aneb nemyslete si, že vás mine! Knihovna [online]. 2010, roč. 21, č. 2, s. 53-68 . Dostupný z WWW: <http://knihovna.nkp.cz/knihovna102/10253.htm>. ISSN 1801-3252.

 

Valid HTML 4.01 Transitional

 

 


 

| nahoru | |obsah| | archiv | | domů |

 | index autorů | | index názvů | | index témat |