Oddělení analytického zpracování | Báze ANL | ANL FULL | Koop. systém článkové bibliografie | Granty | Metodika popisu článků | English




SOUBORNÁ DATABÁZE KOOPERAČNÍHO SYSTÉMU ČLÁNKOVÉ BIBLIOGRAFIE - OPTIMALIZACE INTEGRACE A SPRÁVY HETEROGENNÍCH DAT

Souhrnná zpráva za rok 2003




C Navrhovaná část



C.1 Výsledky řešení



  • Praktická realizace nástrojů pro optimalizaci integrace a správy heterogenních dat v rámci Kooperačního systému článkové bibliografie. Vznikl tak nástroj pro poloautomatickou přípravu dat pro bibliografickou databázi založenou na UNIMARCu a plnotextovou databázi založenou na pojmovém vyhledávání systému TOPIC a metadatech zpřítupňovaných v Dublin Core a jeho aplikacích v HTML, XHTML, XML v kvalifikované a nekvalifikované formě

  • - Realizace a rutinní provoz aplikace pro získávání dat TAMTAM SPECIAL NK (TTSNK).

  • Realizace a rutinní provoz aplikace pro pro automatické generování bibliografických údajů do analytických záznamů a metadat Dublin Core a jejich umístění do plných textů i mimo ně - TamTam Data Extractor (TTDE) - lokální pracovní stanice

  • Návrh a částečná realizace aplikace pro pro automatické generování bibliografických údajů do analytických záznamů a metadat Dublin Core a jejich umístění do plných textů i mimo ně - WWW TamTam Data Extractor (WWW TTDE) - internetová verze TTDE (vývoj aplikace hrazen z projektu Propojení analytických záznamů s plnými texty, koncepce , zadání a testování v rámci tohoto projektu) s propojení linky WWW TTDE na rejstříky báze ANL FULL, příprava a aplikace na propojení WWW TTDE se soubory autorit). Vývojové práce budou probíhat ještě do konce roku, podobně jako testování aplikace , které probíhá v rámci popisovaného projektu.

  • Aplikace pro indexaci dat do plnotextové databáze ANL FULL - rutinní provoz

  • Aplikace pro vyhledávání a zpřístupnění plných textů formou uživatelských formátů - citací s hypertextovými odkazy i bez nich, citací se souhrnem, v Dublin Core, ale i v pracovních formátech ve formě HTML, XHTML, XML. Rozšíření prvků Dublin Core o prvky Anl Core pro české analytické záznamy pro účely zpracování a vyhledávání - rutinní provoz

  • Definice topiků (aktualizace a nové topiky)

  • Definice a automatické generování rejstříků

  • Plnotextové a pojmové vyhledávání

  • Zkvalitnění věcné indexace ve formě předmětových kategorií, předmětových hesel a klíčových slov

  • Statické a dynamické linky na plné texty

  • Průběžné doplňování báze ANL bibliografickými záznamy a báze ANL FULL plnými texty (on line)

  • Průběžné doplňování databáze ANL FULL, propojování bibliografických záznamů s plnými texty na základě dynamických a statických URL adres
  • Údržba a doplňování strukturovaného portálu pro volně přístupné zdroje na WWW v regionální, tematické a institucionální struktuře - rutinní provoz

  • Registrace a autentifikace uživatelů - rutinní provoz

  • Aplikace pro administraci báze ANL FULL (opravy dat, statistiky) - rutinní provoz

  • Návrh a implementace aplikace pro stahování a export plných textů a metadat pro vytypované uživatele - rutinní provoz v rámci možného rámce s ohledem na autorská práva

  • Testování, ladění a vývoj aplikace pro management Kooperačního systému článkové bibliografie (MNG KOSABI), jednotné rozhraní pro aplikaci - poloprovozně funkční upload a testování dat kooperujících institucí , export dat do adresáře pro ALEPH a adresáře určeného k dalším opravám - odzkoušeno v NKČR.

  • Nová aplikace pro test URL adres.

  • Údržba Báze titulů na serveru ANL

  • Standardizace týkající se popisu článků v UNIMARCu a AACR2R

  • Zabezpečení KOSABI po stránce metodické i organizační, navázání poměrně úzké spolupráce se 4 novými krajskými knihovnami - ladění UNIMARCu a delimitace excerpční základny vzhledem k novému státoprávnímu uspořádání

  • Další studium a analýza problematiky automatické či poloautomatické indexace věcné a potvrzení hypotézy orientovat se spíše na automatickou extrakci a využití inteligentního vyhledávání v TOPICu s automatizovanou tvorbou předmětových kategorií , dále pak orientace na skloubení pojmového vyhledávání s intelektuální indexací věcnou a zabudování věcných termínů přímo do topiků, než na automatické přiřazování věcných termínů

  • Potvrzení nutnosti intelektuální indexace věcné, která je stále kvalitnější než automatické přiřazování termínů

  • Analýza selekční úplnosti topiků v bázi ANL FULL a praktické závěry pro zkvalitnění topiků (hrazeno z projektu Propojení analytických záznamů s plnými texty)

  • Důkladná analýza zpracování článků v zahraničí (metody, organizace) a ověření, že podobné a srovnatelné metody se vyvíjejí v rámci tohoto projektu

  • Důkladný průzkum týkající se systémů zpracování článků v zahraničí (národní knihovny a jiné knihovnické instituce a komerční organizace zpracovávající článkové a plnotextové databáze, národní bibliografie)

  • Nastínění perspektiv KOSABI a vznik jeho možných subsystémů z hlediska typu zpracovávaných titulů

  • Prezentace výsledků projektu na konferenci Infos 2003 (Slovensko), zasedání sekce pro bibliografii SDRUK (Hradec Králové), informace pro IFLA Newspaper Section, Berlín 2003 (nabídka členství v této sekci)


C.2 Závěr

Zpracování českých článků prochází transformací, jde o inovaci jak po stránce technické i technologické, ale i koncepční, jde o zkvalitnění báze ANL a diferencované plné zpřístupnění plných textů v bázi ANL FULL. Tyto změny však musí být postupné a citlivé při zachování toho, na co je třeba navázat, pokud nechceme systém zlikvidovat. Systém zpracování a zpřístupnění článků je možno transformovat díky finanční podpoře projektů a do budoucna ošetřit tak, abychom články zpracovávaly moderně. O důležitosti informací uveřejněných v článcích nelze pochybovat. Nemyslím tím pouze informace odborné a vědecké povahy, na které je třeba se především zaměřit v budoucnu.

Spolupráce s Anopressem mohla být navázána díky zmíněným projektům a NK mohla navázat na moderní technologii, kterou tato firma užívá a dále rozvíjí. Báze ANL FULL a určité procento báze ANL vzniká díky spolupráci s touto firmou.

Na zpřístupňování českých plných textů mají vliv nejen vyvíjené technologie, ale i koncepce a strategie zainteresovaných subjektů, jejich smysl a citlivost pro dobrý odhad, znalost věci, transparentnost řešení a schopnost kompromisů, respekt k domácímu terénu a světovým trendům.

Jedním ze základních východisek nového knihovního zákona je, že veřejné knihovny pracují v celostátně koordinovaném systému . Koncepce státní informační politiky ve vzdělávání stanoví

důležitou úlohu veřejných knihoven při zajištění bezbariérového přístupu k informacím všech typů v procesu výchovy a vzdělávání. Vybudování české digitální knihovny je jeden z hlavních úkolů.

V návrhu nové „Strategie rozvoje knihoven 2003-2005“ je formulován hlavní cíl rozvoje knihoven:

„Prostřednictvím národního knihovního systému umožnit občanům rovný přístup k publikovaným dokumentům a informačním zdrojům v jakékoli formě, vytvářet informační zázemí pro výchovu a celoživotní vzdělávání, pro uspokojování kulturních zájmů občanů, pro výzkumnou a vývojovou činnost, pro ekonomické aktivity a pro nezávislé rozhodování jedince.“

Z dílčích cílů: vytvořit integrovaný národní systém knihoven a informačních institucí, který s využitím informačních technologií umožní jejich propojení, kooperaci a zapojení do mezinárodní spolupráce; zajistit realizaci regionálních funkcí knihoven a formovat krajské systémy knihoven; podporovat oborovou organizaci systému knihoven; dosáhnout maximální kompatibility a unifikace knihovnických činností a systémů v národním a mezinárodním měřítku s cílem zlepšit kvalitu služeb, zvýšit efektivitu činnosti knihoven, odstranit duplicitu činností.

 

 

C.3 Návrhy opatření


  • Zajištění financování projektu v roce 2004 a dále zajištění návazného projektu v rámci 1 N programu MŠMT na léta 2004-2008 (projekt se týká zpracování a zpřístupnění odborných infor m ačních zdrojů včetně plnotextových moderními metodami a kooperace zejména s odborně orientovanými institucemi v Kooperačním systému článkové bibliografie, zapojení serveru full.nkp.cz do JIB prostřednictvím Z39.50 a OpenUrl)

  • Projekt Souborná databáze Kooperačního systému článkové bibliografie končí v r. 2004. Bude třeba zajistit financování zdrojů získávaných z Anopressu pro provoz linky budˇ z rozpočtu NK, nebo v rámci Konzorcia Anopress nebo dalším projektem

  • Koordinace s ostatními stávajícími i budoucími projekty v NK i jinde

  • Posílení vazeb stávajícího KOSABI na existující kooperační systémy na nižší úrovni z hlediska správního, zejména systém LANIUS v budoucnu

  • Další rozvoj spolupráce s novými čtyřmi krajskými knihovnami a reálná kooperace v rámci Kooperačního systému článkové bibliografie

  • Užší spolupráce s Národní lékařskou knihovnou v rámci na základě návrhu projektu v programu 1N a nové metody zpracování BMC a CR-CZ (Český citační rejstřík)

  • Personální zajištění projektu z hlediska počtu pracovníků oddělení analytického zpracování v NK i v rámci kooperačního systému

  • Existence souborů autorit v oblasti jmenného a věcného popisu jsou nutným předpokladem kvalitního zpracování a vyhledávání informací. Přesunuté kapacity do příslušných oddělení tuto situaci pomohou řešit

  • Opravy báze ANL a ANL FULL. V ANL zejména sjednocení názvů zdrojových dokumentů a ISSN

  • Zkvalitněné ukládání údajů v rámci NKČR i kooperujících institucí

  • Důkladné posouzení a další ladění dosud existující konverze UNIMARC M21 pro články

  • Průběžné sledování vývojových trendů ve standardizaci a jejich praktická aplikace

  • Přísnější výběr článků k indexaci deníků s cílem vyloučení subjektivního faktoru při excerpci deníků

  • V budoucnu zaměření na zpřístupnění odborných plných textů

  • Funkčnost propojovacích vazeb a možnosti propojování přes OpenUrl v systému ALEPH a Metalib, resp. JIB a možnosti expanze a spolehlivosti systému v tomto ohledu. Moderní informační systémy jsou založeny na propojování sekundárních informací s primárními jak klasickými tak elektronickými, ale také na vzájemném propojování sekundárních informací o různých typech dokumentů. Nejde pouze o propojení záznamů s plnými texty, ale také o provázání seriálů a jednotlivých čísel na analytický rozpis článků obsažených v seriálu v rámci báze NKC či Souborného katalogu CASLIN, dále pak připojení článků - recenzí k recenzovaným dokumentům v rámci těchto bází. Navigační systémy na úplné obsahy čísel seriálů mimo záběr abstraktových databází jsou v zahraničí zcela běžné.Jedním z předpokladů tohoto propojení jsou i kvalitní, pokud možno bezchybná data uložená v bázi ANL. Oprava dat uložených v databázi je aktuálním problémem.

  • Ošetření autorskoprávních aspektů, event. ekonomických aspektů zpřístupňování plných textů externím a vzdáleným uživatelům nejenom na úrovni projektu

  • Smluvní zajištění zpřístupňování báze ANL FULL interním i externím uživatelům, uživatelům v rámci konzorcia Anopress

  • Zapojení báze ANL FULL do Konsorcia Anopress a v budoucnu eventuelně i multilicence na používání linky automatického zpracování pro další knihovny

  • Pokračování Konzorcia Anopress

  • Eventuelní další zpřístupnění elektronických zdrojů v Anopressu

  • Vstřícnost vydavatelů, nakladatelů, autorů

  • Strukturované údaje v plných textech

  • Další vývoj topiků a jejich ladění

  • Zkvalitnění možností vyhledávání v systému TOPIC a integrace termínů věcného popisu do topiků, interakce systému s uživatelem a katalogizátorem

  • Práce na sjednocování rejstříku předmětových kategorií

  • Automatizovaná kategorizace a možnosti koexistence „ručně tvořených předmětových kategorií“ a automatizovaně vzniklých

  • Další zkoumání možností automatické či poloautomatické indexace zejména ve smyslu extrakce údajů , generování topiků on line

  • Nutnost intelektuální indexace věcné

  • Ověření funkčnosti internetová verze linky získávání a zpracování bibliografických záznamů z plných textů (WWW TTDE)

  • Jednání s nakladateli/vydavateli o spolupráci týkající se elektronických zdrojů by mělo být koncepčně vedeno a zaštítěno z vyšší úrovně managementu institucí rovněž tak iniciativy ohledně povinného výtisku elektronických publikací event. autorského práva.
  • Smluvní ošetření týkající se zpřístupnění plných textů.






  • D Použití finančních prostředků

    E Resumé

    Zpět na Granty
    .



    10.9. 2004 Ivana Anděrová


    01.12.12