SOUBORNÁ DATABÁZE KOOPERAČNÍHO SYSTÉMU ČLÁNKOVÉ BIBLIOGRAFIE - OPTIMALIZACE
INTEGRACE A SPRÁVY HETEROGENNÍCH DAT
Souhrnná zpráva za rok 2003 |
C Navrhovaná část
C.1 Výsledky řešení
-
Praktická realizace nástrojů pro optimalizaci integrace a správy heterogenních dat v rámci Kooperačního systému článkové bibliografie. Vznikl tak nástroj pro poloautomatickou přípravu dat pro bibliografickou databázi založenou na UNIMARCu a plnotextovou databázi založenou na pojmovém vyhledávání systému TOPIC a metadatech zpřítupňovaných v
Dublin Core a jeho aplikacích v HTML, XHTML, XML v kvalifikované a nekvalifikované formě
- - Realizace a rutinní provoz aplikace pro
získávání dat TAMTAM SPECIAL NK (TTSNK).
-
Realizace a rutinní provoz aplikace
pro pro automatické generování bibliografických údajů do analytických záznamů a
metadat Dublin Core a jejich umístění do plných textů i mimo ně - TamTam Data Extractor (TTDE) - lokální
pracovní stanice
- Návrh a částečná realizace aplikace pro pro automatické generování
bibliografických údajů do analytických záznamů a metadat Dublin Core a jejich umístění do plných textů i mimo ně - WWW TamTam Data Extractor (WWW TTDE) - internetová verze TTDE (vývoj aplikace hrazen z projektu Propojení analytických záznamů s plnými texty, koncepce , zadání a testování
v rámci tohoto projektu) s propojení linky WWW TTDE na rejstříky báze ANL
FULL, příprava a aplikace na propojení WWW TTDE
se soubory autorit). Vývojové práce budou probíhat ještě do konce roku, podobně jako
testování aplikace , které probíhá v rámci popisovaného projektu.
-
Aplikace pro indexaci dat do plnotextové databáze ANL FULL - rutinní provoz
- Aplikace pro vyhledávání a zpřístupnění plných textů formou
uživatelských formátů - citací s hypertextovými odkazy i bez nich, citací se souhrnem, v Dublin Core, ale i v
pracovních formátech ve formě HTML, XHTML, XML. Rozšíření prvků Dublin Core o prvky Anl Core pro české analytické
záznamy pro účely zpracování a vyhledávání - rutinní provoz
- Definice topiků (aktualizace
a nové topiky)
- Definice a automatické generování rejstříků
- Plnotextové a pojmové vyhledávání
- Zkvalitnění
věcné indexace ve formě předmětových kategorií, předmětových hesel a klíčových slov
- Statické a dynamické linky na plné texty
- Průběžné doplňování báze ANL bibliografickými záznamy a báze ANL FULL plnými texty (on line)
- Průběžné doplňování databáze ANL FULL, propojování bibliografických záznamů s plnými texty na základě dynamických a statických URL adres
- Údržba a doplňování strukturovaného portálu pro volně přístupné zdroje na WWW v regionální, tematické a institucionální struktuře - rutinní provoz
- Registrace a autentifikace uživatelů - rutinní provoz
- Aplikace pro administraci báze ANL FULL (opravy dat, statistiky) - rutinní provoz
- Návrh a implementace aplikace pro stahování a export plných textů a metadat pro vytypované uživatele - rutinní provoz v rámci možného rámce s ohledem na autorská práva
- Testování, ladění a vývoj aplikace pro management Kooperačního systému článkové bibliografie (MNG KOSABI), jednotné rozhraní pro aplikaci - poloprovozně funkční upload a testování dat kooperujících institucí , export dat do adresáře pro ALEPH a adresáře určeného k dalším opravám - odzkoušeno v NKČR.
- Nová aplikace pro test URL adres.
- Údržba Báze titulů na serveru ANL
- Standardizace týkající se popisu článků v UNIMARCu a AACR2R
- Zabezpečení KOSABI po stránce metodické i organizační, navázání poměrně úzké spolupráce se 4 novými krajskými knihovnami - ladění UNIMARCu a delimitace excerpční základny vzhledem k novému státoprávnímu uspořádání
- Další studium a
analýza problematiky automatické či poloautomatické indexace věcné a potvrzení hypotézy orientovat se spíše na automatickou extrakci a využití inteligentního vyhledávání v TOPICu s automatizovanou tvorbou předmětových kategorií , dále pak orientace na skloubení pojmového vyhledávání s intelektuální indexací věcnou a zabudování věcných termínů přímo do topiků, než na automatické přiřazování věcných termínů
- Potvrzení nutnosti intelektuální indexace věcné, která je stále kvalitnější než automatické přiřazování termínů
- Analýza selekční úplnosti topiků v bázi ANL FULL a praktické závěry pro zkvalitnění topiků (hrazeno z projektu Propojení analytických záznamů s plnými texty)
- Důkladná analýza zpracování článků v zahraničí (metody, organizace) a ověření, že podobné a srovnatelné metody se vyvíjejí v rámci tohoto projektu
- Důkladný průzkum týkající se systémů zpracování článků v zahraničí (národní knihovny a jiné knihovnické instituce a komerční organizace zpracovávající článkové a plnotextové databáze, národní bibliografie)
- Nastínění perspektiv KOSABI a vznik jeho možných subsystémů z hlediska typu zpracovávaných titulů
- Prezentace výsledků projektu na konferenci Infos 2003 (Slovensko), zasedání sekce pro bibliografii SDRUK (Hradec Králové), informace pro IFLA Newspaper Section, Berlín
2003 (nabídka členství v této sekci)
C.2 Závěr
Zpracování českých článků prochází transformací, jde o inovaci jak po stránce technické i technologické, ale i koncepční, jde o zkvalitnění báze ANL a diferencované plné zpřístupnění plných textů v bázi ANL FULL. Tyto změny však musí být postupné a citlivé při zachování toho, na co je třeba navázat, pokud nechceme systém zlikvidovat. Systém zpracování a zpřístupnění článků je možno transformovat díky finanční podpoře projektů a do budoucna ošetřit tak, abychom články zpracovávaly moderně. O důležitosti informací uveřejněných v článcích nelze pochybovat. Nemyslím tím pouze informace odborné a vědecké povahy, na které je třeba se především zaměřit v budoucnu.
Spolupráce s Anopressem mohla být navázána díky zmíněným projektům a NK mohla navázat na moderní technologii, kterou tato firma užívá a dále rozvíjí. Báze ANL FULL a určité procento báze ANL vzniká díky spolupráci s touto firmou.
Na zpřístupňování českých plných textů mají vliv nejen vyvíjené technologie, ale i koncepce a strategie zainteresovaných subjektů, jejich smysl a citlivost pro dobrý odhad, znalost věci, transparentnost řešení a schopnost kompromisů, respekt k domácímu terénu a světovým trendům.
Jedním ze základních východisek nového knihovního zákona je, že veřejné knihovny pracují v celostátně koordinovaném systému . Koncepce státní informační politiky ve vzdělávání stanoví
důležitou úlohu veřejných knihoven při zajištění bezbariérového přístupu k informacím všech typů v procesu výchovy a vzdělávání. Vybudování české digitální knihovny je jeden z hlavních úkolů.
V návrhu nové „Strategie rozvoje knihoven 2003-2005“ je formulován hlavní cíl rozvoje knihoven:
„Prostřednictvím národního knihovního systému umožnit občanům rovný přístup k publikovaným dokumentům a informačním zdrojům v jakékoli formě, vytvářet informační zázemí pro výchovu a celoživotní vzdělávání, pro uspokojování kulturních zájmů občanů, pro výzkumnou a vývojovou činnost, pro ekonomické aktivity a pro nezávislé rozhodování jedince.“
Z dílčích cílů: vytvořit integrovaný národní systém knihoven a informačních institucí, který s využitím informačních technologií umožní jejich propojení, kooperaci a zapojení do mezinárodní spolupráce; zajistit realizaci regionálních funkcí knihoven a formovat krajské systémy knihoven; podporovat oborovou organizaci systému knihoven; dosáhnout maximální kompatibility a unifikace knihovnických činností a systémů v národním a mezinárodním měřítku s cílem zlepšit kvalitu služeb, zvýšit efektivitu činnosti knihoven, odstranit duplicitu činností.
C.3 Návrhy opatření
D Použití finančních prostředků
E Resumé
Zpět na Granty .
10.9. 2004 | Ivana Anděrová |