Норвегия
Detektor
Търсещ, анотиран предметен указател на Интернет ресурси, подбрани и оценени от библиотекари на Публичната библиотека в Осло. Техническото решение е разработено от Linux Communications AS, база–данни в MySQL, работеща на Linux сървър. Detektor съдържа Интернет ресурси на норвежки, датски, шведски, английски и други езици. Използват се елементите на Dublin Core за описание на ресурси, но с локални приспособления.
http://detektor.deichman.no/
Samkatalog for privatarkiv
База-данни в уеб, която дава на потребителите достъп до информация за документи в архивите на цялата страна, които нямат публичен характер. Осъществен с помощта на норвежкия стандарт за архивни описания, дефиниран от софтуера Asta.
http://www.riksarkivet.no/samkat/
URN-generator
Доставянето на уникални норвежки уеднаквени имена на ресурси (URNs -Uniform Resource Names) прави възможна идентификацията на Интернет документи. Униформеното име на ресурс, дадено на конкретен документ, е устойчиво и уникално и никога не се рециклира или предоставя на друг документ. Униформеното име на ресурс (URN) може да се използва за намиране на информация в Интернет по много различни начини. Услугата URN резолюция може да позволи на потребителите да превръщат URN в URL или метаданни, свързани с документа.
http://www.nb.no/html/standardnummerering.html
Обединеното кралство
Достъп до архиви
Базата–данни на архива A2A съдържа каталози, описващи колекциите на 352 архивни офиси и репозиториуми в цяла Англия.
http://www.a2a.org.uk/default.asp
SEAX
Проектът е разработен в Офиса за архиви на Есекс. Разделен е на две части – Explorer (модул за персонала) и модул за публичен достъп. С модула Explorer архивистите могат да инвентират, каталогизират, класифицират и съхраняват документи. Explorer дава възможност за управление на класификационните индекси и създаване и свързване на термини чрез използване на тезаурус. Частта за каталогизиране ISAD(G) е съвместима. Explorer дава възможност на персонала да съхранява изображения за всички справки в каталога, които изображения могат да се виждат с PAM. Проектът SEAX дава възможност за управление на различни процеси – инвентиране, каталогизиране, класифициране, тезаурус, складиране на документи, поръчване и произвеждане, както и създаване на търсеща база-данни с улеснения за добавяне на изображения, които след това могат да се разглеждат. http://seax.essexcc.gov.uk/
Полша
MОНА
725,000 музейни предмети (произведения на изкуството) ат античността до наши дни са описани според стандартите за описание CIMI. Стандартният файл съдържа също резултатите от изследване, използващо специални (химически, биологически, биофизически) консервационни техники на музейни материали. http://www.mnw.art.pl
Русия
Музейна колекция на Русия
Уникалността на този проект се дължи на комплексния подход за създаване на многофункционална музейна информационна система. Присъствието на мрежа осигурява възможност за персонала да обменя информация и да се кооперира за създаване на тезауруси и др.
http://www.collections.spb.ru
Сърбия и Монтенегро
Централен морски каталог на Монтенегро
Съвременна база-данни от библиотечни и архивни материали, свързани най-общо с морето и в частност със залива Бока Которска, от най-старите писмени документи до най-новите официални материали и публикации, локализирани във всички видове библиотеки и архиви на Монтенегро (държавни, църковни и частни).
http://www.dacg.cg.yu; http://www.matf.bg.ac.yu/iak
Украйна
Регионална универсална научна библиотека на Кировохрад “Д. Чижевски”: Проект на Dublin Core Metadata
Безплатно он-лайн приложение, което конвертира общи html метаданни към елементите на стандарта за метаданни Dublin Core, а след това, като използва он-лайн EDITOR-Converter, ги превръща в библиографския формат за обмен UNIMARC. Тогава може да ги съхрани в локален твърд диск като файл в ISO-2709 за бъдещо експортиране в библиографски бази-данни.
http://www.library.kr.ua/dc/dcproje.html; http://www.library.kr.ua/dc/dceditunie.html
Мислещо дърво: Украински информационни ресурси за образование и наука
Това е универсална йерархична база-данни, разработена от Института за изследвания и защита на културната памет към Министерството на културата и изкуствата на Украйна. Програмата подпомага визуалното представяне на данни, при което могат да се съхраняват RTF, bitmap и векторни изображения, звукови и видео файлове Проектът съхранява и оперира с данни в различни мултимедийни формати (текст, графика, видео, аудио) в он-лайн режим. Най-важната черта на базата-данни е, че потребителите могат визуално да боравят с порции от данни.
http://www.myslenedrevo.com.ua
Чешка република
ProMuS (Prohlizec muzejnich sbirek)
Проектът подготвя представяне на музейни и други колекции в Интернет. Той се опира на скрипта PHP scripts база-данни SQL. Институтът може да определи начина, по който се представят данните на потребителя. Необходими са скромни знания за програмиране с html. Данни и таблици се импортират чрез текстови файлове и затова е възможно да се импортират данни от почти всеки източник. Могат да се добавят също изображения
http://www.mzm.cz/promus
Обратно към Съдържание
Насоки на Калимера
Откриване и извличане на ресурси
|
ОБХВАТ
Въпросите в тази част включват:
Функционалност и съвместимост
Търсачки
Препоръчителни списъци на сайтове
Входове, хъбове и портали
Кръстосано търсене
Ядра (Clumps)
Търсене и намиране на изображения
Претърсване и събиране (Harvesting)
Семантичният уеб
ПОЛИТИКИ Обратно към Обхват
От дълго време библиотеките функционират в мрежова среда и вече все повече музеи и архиви се включват в мрежата. Приложението на Интернет означава, че дори и най-малкият музей или филиална библиотека могат да имат достъп до постоянно растящия обем от разпространяваната в уеб дигитална информация. Обществото на знанието, учението през целия живот и растящата нужда от взаимодействие с централните власти по електронен път прави лесния достъп до информация все по-важен за всеки гражданин.
Много институти създават дигитално съдържание – било то на техните уеб страници или нови мултимедийни продукти, финансирани от конкретни програми за дигитализация (виж насоките върху Дигитализация и Работни модели). Те трябва да знаят как да правят това ново съдържание удобно за търсене и извличане от потребителите и съвместимо и обменящо се с други източници на дигитално съдържание. Това преди всичко зависи от начина, по който се описва съдържанието от института, който го създава. Затова тази част на насоките трябва да се чете успоредно с насоките върху Описание на ресурси.
Научни доказателства и практически наблюдения сочат, че повечето хора използват търсещи машини като Google, за да търсят информация и по този начин пропускат огромни количества информация, позната като “Дълбокия уеб”, който включва бази-данни на библиотеки, архиви и музеи. В момента търсещите машини започват да се занимават с този проблем и музеите, библиотеките и архивите трябва да проследят неговото развитие.
Технологиите и стандартите в тази област са още в етап на развитие и ще продължават да се променят с времето. Институтите се нуждаят от постоянна текуща информация, за да избягнат внедряване на остарели технологии и стандарти.
Институтите трябва да познават тези въпроси, за да планират добре работата си и поставят приоритети, особено когато създават нови системи или възлагат работа на външни консултанти и контрактори. За преглед на въпросите на извличането на информация виж Challenges in information retrieval and language modelling, под редакцията на Джеймс Алън.
НАСОКИ ЗА ДОБРИ ПРАКТИКИ Обратно към Обхват
Откриването и извличането на информация зависи от начина, по който е описана. Затова тези насоки трябва да се четат, като се вземат предвид насоките върху Описание на ресурси, където се засягат теми като метаданни, терминология (контролни речници и тезауруси) и идентификатори на обекти. Много от технологиите, застъпени в Откриване и извличане на ресурси, са описани и в частта Основни технологии и инфраструктура.
Обратно към Обхват
Функционалност и съвместимост Обратно към Обхват
В контекста на дигиталните ресурси “функционалност и съвместимост” означава възможност за повторно използване на ресурсите, преносимост през различни мрежи, системи и организации и възможно най-дълъг жизнен цикъл. Ключът за постигане на такава функционалност и съвместимост е използването на стандарти – кодирани правила и насоки за създаване, описание и мениджмънт на дигитални ресурси (за повече информация виж статията “Преоткриване на колелото”(Reinventing the Wheel) в D-Lib Magazine, януари 2002 [2]).
Възможността за търсене и извличане на информация от различни източници – от различни каталози, от различни сфери (на музеи, библиотеки, архиви) и от различни видове ресурси (книги, документи, музейни артефакти, аудио-визуални носители) зависи от функционалността и съвместимостта. Това е сфера, благодатна за работа с други организации, например колежи, университети и др., за осигуряване на по-добър достъп до ресурси. (Виж насоките върху Сътрудничество и партньорство). Обикновено партньорите се споразумяват да отворят услугите си и за клиентите на партниращия институт, да осигурят общ достъп до каталозите им, да изграждат сводни каталози и др. (тук терминът “каталог” е употребен в неговия най-широк смисъл, включващ описания на музейни и архивни колекции.)
Има най-общо два подхода за откриване на ресурси: индексиране на съдържанието на ресурса и индексиране на метаданните, описващи ресурса (метаданните могат да са машинно генерирани, съставени от хора, или смесица от двата начина). Изискванията за функционалност и съвместимост, а оттук и препоръките за най-добри практики, могат да са различни в зависимост от това какъв механизъм иска да използва организацията, която осигурява съдържанието.
Търсачки Обратно към Обхват
Каталогът е ключ към фондовете на отделна библиотека, архив. Музеите също документират колекциите си, макар техните каталози не са достояние на потребителите по начина, характерен за библиотеките и архивите. При все това обаче, повечето библиотеки и някои архиви в момента предлагат Интернет достъп на потребителите си, а много музеи имат свое присъствие в Интернет. Те се нуждаят да намерят начини да отворят своите мрежови ресурси към потребителите. Най-лесният начин да направят това е просто да насочат потребителите към една от многото налични търсещи машини (търсачки).
Основните видове търсещи машини са:
-
Търсещи в свободен текст търсачки, които търсят по ключови думи, например:Altavista [3], Google [4];
-
Търсачки, търсещи в състава на указатели от подбрани ресурси, в които потребителят навигира през серия от менюта, постоянно стеснявайки своето търсене, например Yahoo [5];
-
Метатърсачки, които извършват търсения в базите-данни на няколко търсачки едновременно, напр. ixquick [6];.
-
Търсачки, които могат да търсят по т.н. “естествен език” – по зададени изрази, които следват нормалния езиков синтаксис. Търсенето може да бъде зададено като въпрос, както е например в Ask Jeeves [7].
Има също и тематично специализирани търсачки, както и персонализирани търсачки.
Търсачката Google (както и други търсещи в безплатен текст търсачки) функционират, като използват “робот”, който проследява хипервръзки в уеб страници и извлича пълния текст от тези страници. После търсачките изграждат индекси от тези текстове и осигуряват търсене в тези индекси. Ценността на тези услуги идва от алгоритъма за подреждане на резултатите в рамките на целия списък с резултати. Много успешното и популярно подреждане на резултати при Google става по броя линкове към дадена страница. За да са сигурни, че ресурсите им ще се откриват чрез Google, тези, които предоставят съдържание в Интернет, трябва да имат предвид следните фактори (списъкът не е подробен):
-
роботът се нуждае от “начална точка”, от която да проследява всички хипервръзки;
-
роботът трябва да има достъп до страници за индексиране – самият ресурс или документ, който го описва, чрез протокола HTTP (Hypertext Transfer Protocol) [8], така че страниците за индексиране да не са скрити зад искания за идентификация на потребител. Някои роботи не проследяват URL, съдържащи параметри, така че URL адресите трябва да се конструират по лесен и удобен за търсачките начин;
-
URL адресите на индексираните страници трябва достатъчно последователно и надеждно да изпълняват функцията “обратна препратка” /de-reference/, така че когато търсачката проследи определен линк в страницата с резултати, да може да се види точно същата страница, която е била индексирана;
-
страниците трябва да съдържат кратки вградени метаданни (метатагове), които търсачката използва в списъка при показването на намерените ресурси (заглавие, описание, понякога ключови думи и др. );
-
дори ако страницата е открита от робота за индексиране, нейното поредно място в списъка с резултатите зависи от алгоритми като този на Google (Google’s Page Rank [9]). Ако има много малко хипервръзки към тази страница, тя няма да бъде изведена в първите места на списъка с резултати.
Откриването на ресурси с помощта на метаданни, от друга страна, разчита на производителя на съдържание, който показва записи с метаданни с две цели: за улеснение на индексирането и за кръстосано търсене в реално време от доставчика на услугата за откриване и извличане на данни. Производителят на съдържание и доставчикът на услугата трябва да се споразумеят за:
-
употребата на протокол за обмяна на съобщения;
-
езикът и синтаксисът на търсенето;
-
схеми за метаданни:
-
въпроси на правата над интелектуалната собственост;
-
въпроси на идентификацията на потребителя и достоверността.
Качеството на услугата зависи също от качеството и съгласуваността на записите от метаданни от различни производители на уеб съдържание.
Някои търсачки осигуряват алтернативни начини за търсене, включително “просто търсене”, при което потребителят въвежда ключова дума, и “усъвършенствано търсене” , при което се използват булевите оператори, съкратен вариант на думата (truncation) и др. Вторият начин обикновено извиква по-добри резултати Друг пример за инструментариума на търсачките е указателят на Google Google Directory [4], който позволява търсене на локална информация (в момента само от САЩ и Канада, но се планира разширение на услугата).
Пълен списък на всички видове търсачки и повече информация за тях, включително как да търсим, се намира на уеб сайта на Фил Брадли [10] и на сайта Search Engine Watch [11]. Тези страници предоставят информация за търсенето в уеб, анализи на индустрията на търсещи машини и помощ за собствениците на сайтове за това как да подобрят откриваемостта на техните ресурси в уеб.
Препоръчителни списъци от сайтове Обратно към Обхват
Институтите могат да обмислят още по-голямо улеснение за потребителите, като предложат списъци от полезни сайтове. Типично за такива списъци е, че ресурсите се избират и оценяват според определени критерии за качество често се категоризират по предмет. (Проектът Desire изработи полезна глава за качеството и оценката в неговия Наръчник за информационни портали (Information Gateways Handbook [12])). Мрежата RDN (Resource Discovery Network) [13] е подходящ пример за такива препоръчителни списъци. Поддържането и актуализирането обаче на такъв списък може да изисква много време. Институтите могат да се кооперират едни с други в създаването и поддържането на такива списъци. Интегрираната каталогизираща услуга Connexion на OCLC [14] също е добър пример за кооперирана инициатива за създаване на описания на уеб страници. (Виж също и Портали).
Входове, хъбове и портали
Обратно към Обхват
Разликата между входове (gateways), хъбове (hubs) и портали (portals) е по-скоро неясна, но обикновено входовете и хъбовете се състоят от поредица анотирани линкове към други уеб сайтове, преглеждани и проверявани от съставителите на тези входове. На потребителя се представя серия от менюта, които го повеждат от общи термини към по-специфични. Подобни сайтове са изключително полезни за научните изследователи, тъй като спестяват усилията за разглеждане на множество отделни сайтове върху конкретна тема, от които само един или два са със задоволително качество. За разлика от входовете и хъбовете, порталите събират заедно на едно място съдържание от разпръснати източници, като използват технологии като претърсване (harvesting), кръстосано търсене или метатърсене и го представят в обединена форма на потребителите. Те могат да доставят и други услуги като например он-лайн пазаруване.
Невъзможно е да се изброят всички входове и портали, но ето някои примери:
-
Общи – Yahoo [15], серия от менюта, обхващащи World Wide Web като цяло;
-
Правителства - Directgov [16], списък на уеб сайтове на британското правителство, подредени азбучно и тематично; Premier Ministre [17], вход към агенциите на френското правителство;
-
Академии - the Resource Discovery Network (RDN) [13], създадена в помощ на нуждите на висшето образование във Великобритания. Това е мрежа от индивидуални тематични входове или хъбове, като всеки от тях покрива специфичен предмет. Мрежата претърпява по-нататъшно развитие чрез Проекта за предметни портали (Subject Portals Project (SPP) [18]); Проекта за научен портал на асоциацията на научните библиотеки в САЩ (ARL Scholars Portal Project [19]), който цели да осигури софтуерни инструменти за академичната общност, така че да има едно централно място за достъп в уеб за намиране на висококачествени ресурси до възможно най-голяма степен; да доставя информация и свързвани с нея услуги директно до потребителското бюро; Друг пример е Infomine: Scholarly Internet Resource Collections [20];
-
Музеи – Музей 24 часа (24 Hour Museum [21]); Датски музеен портал (Dutch Museums Portal [22]); Латвийски музеен портал Latvian Museum Portal [23];
-
Библиотеки – Библиотечен портал на ЮНЕСКО (UNESCO libraries portal [24]); Библиотечен индекс на Интернет (Librarians’ Index to the Internet [25];
-
Архиви – Архивен портал на ЮНЕСКО (UNESCO archives portal [26]; национален архивен портал на Великобритания [27]; Достъп до Архиви A2A (Access to Archives) [28], английския клон на британската мрежа от архиви;
-
Култура - Culture [29], Портал за култура на Европейската комисия;
-
Други - Infobel [30], линкове към он-лайн телефонни указатели.
Съществуват специализирани софтуери за развитие и поддръжка на тематични портали. Такъв е например ROADS (Resource Organisation And Discovery in Subject-based services) [31]. Комерсиални компании също предлагат софтуер за портали, напи. Vignette [32], SAP Portal [33], Plumtree [34], ZPORTAL [35] и др. Някои институти от сферата на културното наследство създават свои собствени входове и портали – например за да подпомагат т.н. “ядра” (“clumps”), услуги за обществена информация, и да осигуряват помощ в обучението.
Кръстосано търсене Обратно към Обхват
Кръстосаното търсене позволява едновременно търсене в много бази данни.
С кръстосано търсене в няколко обединени тематични области потребителите могат да получат достъп до богата селекция от информационни ресурси само от един търсещ интерфейс. Потребителят, например, може да извлича книги, архивни документи и информация за музейни обекти само с едно търсене по темата, която го интересува. Това може да стане по различни начини:
-
експортиране на цялата информация в нова база-данни, като се използва напр. софтуера SOAP [36] или Harvest. Това би включило експортиране на цялата съществуваща информация в определен формат така, че да бъде натоварена на една централна база-данни. Възможни са затруднения като:
-
получаване на съгласието на всеки собственик/мениджър на източника на данни;
-
работа с няколко различни системни доставчици;
-
справяне с разлики в структурата на данните, особено при работа с източници от различни сфери на дейност (виж насоките върху Описание на ресурси) ;
-
организиране на редовни актуализации.
-
разпръснато търсене. Това означава отделните бази-данни да останат без промяна и да се осигури един търсещ инструмент, който, например, да търси във всички бази-данни, използвайки протокола за търсене и извличане Z39.50. Трудностите при този метод произтичат от разлики в структурата на данни, полета и др., особено ако участват локално създадени данни, не подчинени на общи стандарти;
-
съединяване на базите в едно за кръстосано търсене чрез общ портал. Проблеми могат да възникнат отново от разлики в структурирането на данни и от това, че може да има много малко общи полета за търсене.
Кръстосаното търсене може да бъде улеснено, когато:
-
всички доставчици на сървър Z39.50 внедрят един общ профил (напр. Bath Profile [37]);
-
всички сфери на дейност използват Dublin Core, за да приведат техните различни стандарти за елементи на метаданни към една общоприета структура (включително за локално създавана обществена информация, за която все още няма приет стандарт за описание и съхранение); Marc 21 [38] има подобна структура за обществена информация, но тя не е широко използвана. Проектът за общи портали с обществена информация CASP (Community Advice, Seamless Portals) [39]) препоръчва Dublin Core.
Z39.50 е международен протокол за търсене и извличане на информация (ISO 23950:1998 [40]), който позволява търсене в хетерогенни бази-данни, обикновено отдалечени, и извличане на данни чрез един общ потребителски интерфейс.
Z39.50 определя стандартния начин за комуникация и споделяне на информация между два компютъра. Замислен да поддържа търсене и извличане на пълнотекстови документи, библиографски данни, изображения и мултимедия, той е изграден на принципа клиент-сървър и е напълно функционален в Интернет. Позволява на потребителите да търсят в няколко каталога или други бази-данни чрез едно единствено интегрирано търсене. Забележка: Докато не се усъвършенства езикът на търсене при XML, протоколът Z39.50 ще бъде предпочитан протокол за търсене и извличане от системи, предлагащи сложно разпръснато търсене.
Уеб услугата за търсене и извличане на данни SRW (Search/Retrieve Web Service) е търсене в бази-данни, съдържащи метаданни и обекти, както текстови, така и нетекстови. Тази инициатива се изгражда върху основата на Z39.50 и уеб технологии [41].
Ядра (clumps) Обратно към Обхват
Ядро е група от бази-данни, които имат общи черти, напр. група от каталози за кръстосано търсене чрез Z39.50 на ресурсите на група организации, обикновено музеи, библиотеки или архиви. Важен елемент на такива ядра е порталът, който предоставя на потребителите начин за извършване на едновременни търсения в каталозите/базите-данни на всички участващи организации. Динамичното групиране в ядра (clumping) е начин за автоматично генериране на мини-ядра за кръстосано търсене, с други думи, механизъм, който подпомага навигирането на потребителите в огромни разпръснати ядра. Например може да се търси само в онези каталози, които са богати по определена тема. За да се постигне това, ядрото трябва да възприеме общ профил, към който да се придържат и равняват използваните разнообразни профили между членовете на консорциума. Редица профили са разработени специално за този вид дейност, например Bath Profile [37] и ONE-2 Profile [42]. Лицензирането и авторските права на разнообразните електронни ресурси, предоставяни чрез ЯДРАТА, могат да бъдат проблематични. Входовете, порталите и ядрата могат да бъдат използвани за услуги като например т.н. обществена информация.
Търсене и намиране на изображения Обратно към Обхват
До неотдавна изображенията се търсеха по текстови описания или класификационни индекси, подпомагани в някои случаи от софтуерни пакети за извличане на текстове, предназначени или адаптирани специално за боравене с изображения. Тезаурусът Гети за изкуство и архитектура AAT (Art and Architecture Thesaurus) [43] съдържа 120,000 термина за описание на обекти, текстови материали, изображения, архитектура и материали, свързани с културното наследство. Изображенията могат също да бъдат класифицирани чрез системи като ICONCLASS [44] за произведения на изкуството и музейни изложби и Класификацията за обществена история и музейни обекти (Social History and Industrial Classification for museum objects [45]).
Сега по-модерни системи могат да търсят и намират изображения, без те да бъдат словесно описвани. Съдържателното търсене и намиране на изображения CBIR (Content Based Image Retrieval) не използва индексиране по ключови думи. По-скоро изображението се извлича, като се използват присъщи характеристики като цвят, структура на тъканта или форма, напр. картина от крайбрежието би била синя в горната част и жълта в долната. За технически дискусии върху различните видове CBIR виж Eakins, John P. and Graham, Margaret E.: Content-based Image Retrieval: a report to the JISC Technology Applications Programme [46].
Има комерсиални варианти на CBIR, например системата за търсене по съдържанието на изображението IBM’s QBIC (Query by Image Content)ю [47], където изображението се описва с цветове и форми и извличащият софтуер извършва търсене на изображения, съответстващи на описанието. Не е необходимо да се указва какъв е предметът на изображение. За демонстрация на QBIC виж уеб сайта на Hermitage Museum (виж Връзки.) Фирмата BT Exact разработи първоначален модел, наречен Градина за пазаруване (Shopping Garden [48], който използва интерактивни техники за разглеждане, показвайки на потребителя селекция от изображения и проследявайки неговите предпочитания, докато се стигне до исканото изображение.
За консултации върху извличане на изображения виж Searching for and Retrieving Digital Images. TASI (Technical Advisory Service for Images) Advice Paper, 2002 [49].
Претърсване и събиране (Harvesting, от “harvest” - реколта, жъна) Обратно към Обхват
Софтуерът за претърсване е начин за проследяване и събиране на метаданни от списък на предварително определени уеб ресурси, например уеб страниците на участващите в общ проект организации.
В британския проект Seamless (виж Връзки), софтуерът Harvest създава файл показалец, който системата претърсва в отговор на потребителско питане. Тогава резултатите се обединяват с резултатите от търсенето с протокола Z39.50 и се излагат пред потребителя в един общ списък с резултати. Щракването с мишката върху който и да е от резултатите отваря или уеб страница (от претърсваните записи), или запис от бази-данни (за записите от Z39.50).
Инициативата Отворени архиви (OAI) [50] е кооперирано начинание за улесняване намирането на информация в уеб чрез разработка и приложение на стандарти за съвместимост и функционалност в различни среди (interoperability standards). Инициативата Отворени архиви е разработила прост протокол за събиране на метаданни OAI-PMH [51], който позволява редовно претърсване и събиране на записи от метаданни на една услуга от друга, втора услуга.
Културният сектор успешно се възползва от протокола OAI-PMH, като увеличи откриваемостта на ресурсите чрез тематични портали и мрежи за откриване на ресурси като британската RDN (Resource Discovery Network). Една от причините за успеха е, че OAI-PMH е сравнително лесно приложим в културните институти, поддържащи уеб сървъри, базирани на общи основни уеб стандарти (HTTP, XML и XML схеми). Операциите, поддържани от OAI-PMH, позволяват на културните институти да действат като доставчици на данни, а на доставчика на услугата да изиска копие от всички записи на метаданни, или част от записите на метаданни, като напр. тези, модифицирани след определена дата. Културните институти могат да обмислят предоставянето на своите метаданни за претърсване и събиране, като създадат репозиториуми от метаданни, съвместими с OAI (Инициативата Отворени архиви). Задължителното минимално изискване за протокола OAI-PMH е опростената схема на Dublin Core (unqualified Dublin Core), но културните институти трябва да обмислят прилагането на подсхемата за култура DC.Culture на Dublin Core, за да улеснят откриването на ресурси. Институтите, които създават репозиториуми с метаданни от типа OAI, трябва да включат изявление за интелектуалните права над техните метаданни, за да се гарантира, че те остават притежатели на тези метаданни. За повече информация виж Foulonneau, Muriel (ed.): Open Archives Initiative – Protocol for Metadata Harvesting: practices of cultural heritage actors. September 2003 [52], и уеб сайта на UKOLN в частта “Често задавани въпроси” [53].
Инициативата Отворени архиви (OAI) ще улесни развитието на дигитални библиотеки в областта на културното наследство, които обединяват съдържанието на институти, съхраняващи паметта на човечеството и добавят нови услуги за нова аудитория. Вероятно тя ще доведе до създаване на общества от доставчици на данни, които споделят стандарти, терминологични ресурси, съдържание и услуги.
Семантичният уеб (виж Насоките върху Основни технологии и инфраструктура)
Обратно към Обхват
Семантичният уеб е визия, описана във вoдещата статия на списанието “Scientific American” от май 2001 [54]. Според Тим Бърнърс-Лий, директор на консорциума World Wide Web (W3C) “Семантичният уеб е паяжина от данни, нещо като глобална база-данни”. Това твърдение подкрепя идеята, че “целта на WWW е да бъде полезен не само за комуникация между хората, но че и машините трябва да са способни да участват и помагат”. Но Семантичният уеб има да извърви дълъг път, преди да се сбъдне мечтата на Тим Бърнърс-Лии. Той ще се изгражда на етапи от хора с различни интереси. Истинската сила на Семантичния уеб ще се осъзнае, когато хората създадат много програми, които събират уеб съдържание от разнообразни източници, обработват информацията и обменят резултатите с други програми. Семантичният уеб позволява описателната информация да бъде изразена и представена във форма, която софтуерните приложения могат да експлоатират по-ефективно, отколкото понастоящем. В частност, той позволява видовете отношения, които съществуват между ресурсите, да бъдат изразени или представени във форма, която софтуерните приложения могат да обработят. Например, ако някой планира почивка, те могат да търсят и да съберат карти, пътнически разписания, списък с хотели, прогнози за времето, места за посещение и др. Тогава те могат да изработят маршрут, да изберат хотел и да направят необходимите резервации. Приложенията на Семантичния уеб ще бъдат в състояние да правят връзките между пръснати късчета информация и да съберат заедно целия пакет, както би направила една пътническа агенция. Това зависи от по-нататъшното развитие на онтологиите като RDF [55], DAML+OIL [56] и OWL [57]. Подробно описание и дискусия върху семантичния уеб може да се намери в доклада на DigiCULT “Към Семантичен уеб за ресурси в областта на културното наследство” [58].
В тази очаквана следваща стъпка Семантичният уеб ще разчупи рамката на виртуалния свят и ще навлезе във физическия. Представата за микровълнова печка, която е свързана с уеб и търси готварски инструкции на уеб сайта на производител на замразени храни, може един ден да се прибави към услугите на музеи, библиотеки и архиви. За една виртуална рамка за картина, например, може да се иска съвет от местен музей или галерия коя е идеалната картина за нея, а местната виртуална публична библиотека да подскаже коя е идеалната електронна биография , която й подхожда и която може да се свали от Интернет.
Достарыңызбен бөлісу: |