Oddělení analytického zpracování | Báze ANL | ANL FULL | Koop. systém článkové bibliografie | Granty | Metodika popisu článků | English



PROPOJENÍ ANALYTICKÝCH ZÁZNAMŮ S PLNÝMI TEXTY
A OPTIMALIZACE ZPŘÍSTUPNĚNÍ PLNÝCH TEXTŮ

Závěrečná zpráva za rok 1999-2003




D Použití finančních prostředků - institucionální podpory (tabulky, komentář)


Finanční prostředky byly během řešení projektu a zejména v jeho počátcích silně redukovány vzhledem ke zpřístupnění zahraničních plných textů v programu LI MŠMT. V r. 2001 byly jasněji specifikovány a s ohledem na nákup internetové licence dimenzovány částečně do investic. Činnosti v jednotlivých letech částečně přizpůsobeny projektu Souborná databáze, se kterým je záměr komplementární.


Rok 1999

Tabulka


Komentář

Neinvestice 244 000,-
Služby
V r. 1999 byly nakoupeny tyto služby: plné texty od Anopressu, digitalizace periodika Národní knihovna v Anopressu, nákup licencí pro přístup do databanky TamTam, monitoring médií Anopress pro NKČR, vývoj aplikace pro vyhledání v periodiku Národní knihovna v Anopressu, aplikace pro vyhledávání adekvátních plných textů v databázi TamTam vhodných k propojení s bibliografickými záznamy ANL, vývoj aplikace k off-line propojení těchto záznamů s plnými texty, přípravné práce k propojení.

Rok 2000

Tabulka




Komentář

Neinvestice 229 000,-
Služby 99 000.-
Licence 60 000.-
Mzdy (OON) 70 000.-

Neinvestice
Služby

Pravidelný monitoring médií pro oddělení Public Relation a ředitele NKČR dle zadaného profilu. Nákup plných textů odpovídajících profilu zpracovávaných článků za účelem propojení analytických bibliografických záznamů s těmito texty- cca 9350 plných textů.
Vedení projektu a koncepční práce, které jsou východiskem pro další projekt VaV Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat. Experimentální tvorba témat - topiků v rámci systému TOPIC, který je založen na pojmovém vyhledávání. Globální opravy - doplnění údajů do elektronických adres v bibliografických záznamech připravených k propojení s plnými texty a činnosti týkající se propojení.
Instalace počítače v oddělení analytického zpracování.
Nedošlo k nákupu 6 PC z důvodu krácení prostředků. Naopak došlo k zakoupení licence pro přístup do báze TamTam.
Mzdy
Pracovníci oddělení analytického zpracování uváděli částečné adresy plných textů do bibliografických záznamů a zároveň tyto texty stahovali v rámci Konzorcia Anopress (příprava k propojení s plným textem). Dále byly propojovány biliografické záznamy zpracované v rámci oddělení s plnými texty vystavenými na Internetu. Byly prováděny nejnutnější opravy bibliografických záznamů. Podrobné čerpání těchto prostředků je uvedeno v tabulce Mzdy 2000.
Licence
Licence na plné texty pro přístup do mediální databanky Anopress - TAMTAM v rámci konzorcia Anopress.

Rok 2001
Tabulka


Komentář

Neinvestiční prostředky 757 000,-
Služby 627 000,-
Opravy a údržba 20 000,-
Materiál 40 000.-
Mzdové prostředky 70 000.-

Investiční prostředky200 000,-

Neinvestice

Služby
Technická podpora pro intranetovou a internetovou licenci - Tovek, s.r.o. WWW stránky periodika Národní knihovna: knihovnická revue - pdf a html formát, rejstříky. Pravidelný monitoring médií pro oddělení Public Relation a ředitele NKČR dle zadaného profilu.Úpravy technologie linky automatické indexace, konverze výstupu z linky do UNICODE, konverze metadat do XML, layout www stránek a aplikace pro vyhledávání v plných textech - formuláře, rejstříky, portál pro www periodika volně přístupná. Tvorba topiků.
Zakoupení XP pro WIN (Access). Koncepční práce, které jsou východiskem pro další (související) projekt VaV Souborná databáze kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat.

Opravy - údržba
Nákup síťových karet.

Mzdové prostředky
Pracovníci oddělení analytického zpracovávali od poloviny května záznamy z celostátních deníků a některých časopisů (Reflex, Respekt, Ekonom, Týden) v lince automatické indexace. Šlo o postupné ladění linky, testování a kontrolu záznamů, které se importují zároveň do bibliografické báze ANL a fultextové databáze s metadaty v plných textech v podobě DC, XHTML XML. V rámci mezd byly dále činnosti související s tvorbou www stránek pro oddělení článkové bibliografie a Kooperační systém článkové bibliografie (např. Metodika popisu článků ve formátu UNIMARC a AACR2R).
Materiál
V rámci materiálu byly zakoupena síťová laserová tiskárna 2200 DN a diskety.

Investice
Z investičních prostředků byla zakoupena roční internetová licence pro prezentaci metadat a plných textů na internetu.

V tomto roce nebyl zakoupen scanner, OCR a vypalovačka (až v následujícím roce), ale byla zakoupena část internetové licence pro VIS (TOPIC). Upgrade serveru byl proveden až v následujícím roce.


Rok 2002

Tabulka





Komentář

Neinvestiční prostředky: 457 000,-
Služby 337 000,-
Opravy a údržba 20 000,-
Materiál 30 000,-
Mzdové prostředky (OON) 70 000,-

Investiční prostředky: 500 000,-

Neinvestice
Služby

Tvorba topiků, interface pro administraci báze ANL FULL a strukturovaného portálu pro volná www periodika (aktualizace dat, statistiky), částečný převod linky automatické indexace/extrakce (TTDE) do www prostředí (hrazeno též z projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat). Údržba serveru full.nkp.cz a báze ANL.FULL - realizován upgrade a update serveru full.nkp.cz (instalace WIN 2000, nové verze TOPIC - verze 3.7 Portal One, zvýšení kapacity disku na 68 GB, RAM na 1 GB - částečně též hrazeno z projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat).
Technické provedení prezentace pro konferenci Inforum 2002. Vystavení periodika Národní knihovna č. 4, 5,6,9/1999 + 3,4/1999 + 1,2/2002 v příslušných formátech na WWW, tvorba hesláře, opravy báze ANL vzhledem k bázi autorit (opravy kombinované a hromadné). Interface pro přístup do Báze titulů v rámci managementu Kooperačního systému článkové bibliografie. Studie Současný stav a trendy automatické indexace dokumentů. Koncepční práce, které jsou východiskem pro další (související) projekt VaV Souborná databáze kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat.

Opravy a údržba

Upgrade počítače.

Mzdy (OON)

Pracovníci oddělení analytického zpracování vykonávali tyto činnosti: propojení bibliografických záznamů s volně přístupnými plnými texty na www, opravy údajů jmenného a věcného popisu v rámci báze ANL (i záznamů kooperujících institucí) - překlepy, sjednocování popisu, kontrola oproti souborům autorit aj., příprava nových a aktualizace starých www stránek týkajících se projektu. Další pracovníci: aktualizace podkladů pro program pro import záznamů do ALEPHu, tvorba topiků (které nebyly hrazeny ve službách), analýza selekční úplnosti topiků jako podklad pro jejich další vyhledávání v systému TOPIC.

Materiál

Z finančních prostředků pro materiál v rámci neinvestičních prostředků byla zakoupena "vypalovačka" pro CD ROM, náplně do tiskárny a diskety. ScanJet+OCR - zařízení bylo zakoupeno pro skenování předloh. Finance na materiál byly přečerpány o 9.40 Kč. Tato částka je hrazena z rozpočtu NKČR.

Plánovaná služební cesta byla realizována až v r. 2003.

Investice

Upgrade roční internetové licence pro VIS (TOPIC - verze Portal One) a technická podpora internetové a intranetové licence.


Rok 2003

Tabulka






Neinvestiční prostředky 523 000,-
Služby 395 000,-
Cestovné 58 000,-
Mzdové prostředky 70 000,-

Investiční prostředky 530 000,-

Neinvestice
Služby
Tovek, s.r.o. - ultranet VIS - technická podpora.
Tvorba topiků. Design a funkční aplikace internetové verze linky s propojením na rejstříky ANL FULL a národní autority s možností oprav metadat (automatické získávání plných textů, indexace bibliografických záznamů a plných textů, propojování záznamů s plnými texty on-line a zpřístupňování plných textů - úpravy pracovního formuláře, úprava hlaviček, vyhledání - formuláře, rejstříky, zpřístupnění - uživatelské formáty, pracovní formáty - DC, XHTML, XML - hrazeno též z projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat). Částečná konverze UNIMARC M21 (hrazeno též z projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat). Analýza topiků a úplnosti vyhledávání v bázi ANL FULL. Z39.50 toolkit klient pro napojení internetové verze linky na autority. Cestovné
Účast na zasedání IFLA 2003 (69th IFLA Council and General Conference, August 1.-8. 2003, Berlin).

Mzdy (OON)
Pracovníci oddělení analytického zpracování vykonávali tyto činnosti: propojení bibliografických záznamů s volně přístupnými plnými texty na www, korektury údajů jmenného a věcného popisu v rámci báze ANL (i záznamů kooperujících institucí) - překlepy, sjednocování popisu, kontrola oproti souborům autorit aj., kontrola záznamů produkovaných v lince automatické indexace v Alephu a Topicu, vystavení periodika Národní knihovna na www (4/02, 1-2/03, rejstříky, current kontent 1/99-1/2003). J. Schwarz - analýza selekční úplnosti topiků jako podklad pro optimalizaci vyhledávání v systému TOPIC. Koncepce, administrace a metodika projektu.

Investice
Roční internetová licence pro VIS (TOPIC - verze Portal One), technická podpora internetové a intranetové licence

Sumarizace finančních nákladů r. 1999-2003

Rok Suma Investice Neinvestice
(z toho licence, mzdy, materiál, údržba)
2003 1 053000 530 000 523 000
(z toho cestovné 58 000, mzdy 70 000)
2002 957 000 500 000 457 000
(z toho materiál 30 000, údržba 20 000, mzdy 70 000)
2001 957 000 200 000 757 000
(z toho licence 60 000, mzdy 70 000)
2000 244 000 0 244 000
1999 229 000 0 229 000
Suma 3 440 000 1 230 000 2 210 000



E Resumé a klíčová slova

E.1 Resumé a klíčová slova v češtině

Resumé:

Náplní projektu je propojení analytických záznamů zpracovávaných v Kooperačním systému článkové bibliografie s plnými texty a optimalizace zpřístupnění plných textů. Byla stanovena optimální kombinace plných textů k propojování: plné texty (deníky, některé časopisy) získávat z databáze TamTam a následně extrahovat a editovat metadata, generovat (Dublin Core, UNIMARC, URL, SICI) - importovat biliografický záznam do báze ANL, plný text s metadaty do báze ANL FULL (zde generovat HTML,XHTML,XML; z báze ANL staticky propojovat volné plné texty na WWW z odborných časopisů. Báze ANL a ANL FULL jsou propojeny přes statické URL, dynamická URL je generovaná při vyhledávání v ANL FULL. V JIB je možné statické linkování i linkování přes OpenUrl, resp. SFX. Propojení na zdrojový dokument se realizuje pomocí SFX. Tendence je otevřené propojování s plnými texty vystavenými na webu i organizovanými v databázích pomocí OpenURL a SFX. Úspěch propojování předpokládá jednotnou formu ukládaných metadat a minimální chybovost (rozsáhlé korektury báze ANL). Portál Periodika na WWW zpřístupňuje plné texty ve struktuře oborové a regionální. Optimalizace zpřístupnění plných textů z věcného hlediska předpokládá integraci pojmového vyhledávání s vyhledáváním pomocí řízených termínů. Propojení přes OpenURL může jít hypoteticky až na úroveň plnotextového vyhledávání.
Systém TOPIC, ve kterém je budovaná báze ANL FULL, je založen na pojmovém vyhledávání a na interakci s uživatelem. Uvedené nástroje umožní v budoucnu optimalizovat zpřístupnění i českých odborných textů. Pro přístup do databanky českých plných textů TamTam bylo založeno konsorcium Anopress.

Klíčová slova:

Plné texty; propojování; zpřístupnění; optimalizace; OpenUrl; SFX; Jednotná informační brána; pojmové vyhledávání; TOPIC; topiky; Dublin Core; XML; XHTML; MARC; metadata; otevřené propojování; uzavřené propojování; statické propojování; dynamické propojování ; ANL; ANL FULL; Kooperační systém článkové bibliografie; konsorcium Anopress; analytické zpracování; automatická indexace; extrahování; seskupování

E.2 ABSTRACT AND KEY WORDS IN ENGLISH

Abstract

The content of this project is linking if Analytical records born in Co-operative system of Article bibliography and optimization full text access.
Optimal combination of linking has been stated: to acquire full texts (daylies, journals) from TamTam database, extract and edit metadata in workflow of automated exctraction indexing with generation of Dublin Core, UNIMARC, URL, SICI, import of bibliographic data to ANL database, full texts with metadata fo ANL FULL database (generation of HTML. XHTML, XML in the same time); static linking from ANL database to free www branch periodicals has been stated , too. Dynamic URLs are generated in ANL FULL database. In UIG statics links and OpenUrls are possible, linking to source document by means of SFX as well. Open linking is a trend now by means of OpenURL and SFX. An unified form of proper metadata is suspected for succcess in linking. An application of www periodicals portal was realized (regional and banch structure), too.

Integration of full texts retrieval with controlled vocabularies is trend in retrieval optimization. OpenUrl linking can go to full texts, too. System TOPIC (ANL FULL database) is concept based one, interraction is possible. A consortium for database TamTam (Anopress) has been established.

Key words:
Full texts; linking; access; optimization; OpenUrl; SFX; UIG; concept based retrieval; TOPIC; topics; Dublin Core; XML; XHTML; MARC; metadata; open linking; closed linking; static linking; dynamic linking; ANL; ABL FULL; Co-operative system of Article Bibliography analytical indexing; consortium Anopress; analytical indexing; machine-aided indexing; automatic extraction indexing; abstracting; clustering



29. ledna 2004


PhDr. Vojtěch Balík, ředitel NKČR

PhDr. Ivana Anděrová, hlavní řešitelka


F - Přílohy

Zpět na Návrhová část

Zpět na Granty


18.5. 2004 Ivana Anděrová


01.12.12