Szkoła Web 3.0 The School of Semantics

3lut/10

Semantyczne Biblioteki Cyfrowe – cz. 1: Wprowadzenie

W czasie swojej pracy naukowej często spotkałem się z raczej mało popularnymi w Polsce studiami poświęconymi informacji i bibliotekom (ang. Information Science and Library Studies). Po części pokrywają się one z tym co można się dowiedzieć na piewszych latach studiów informatycznych w Polsce, jednak są silnie ukierunkowane na zarządzanie informacją, szczególnie w kontekście bibliotek cyfrowych.

Pamiętacie zapewne lekką ontologię Dublin Core, którą omawiałem w październiku zeszłego roku. Jest ona jedną z najstarszych i prawdopodobnie najbardziej popularnych ontologii stosowanych nie tylko w Web 3.0, ale i w szeroko rozumianym Internecie. Być może część z Was już wie, że standard Dublin Core wywodzi się tak na prawdę ze środowiska bibliotekarskiego. Inną ontologią ściśle związaną ze środowiskiem bibliotek cyfrowych jest SKOS, o której też pisałem w zeszłym roku.

Te ontologie, jak i inne standardy powstały właśnie w wyniku badań naukowych prowadzonym w ramach projektów bibliotek cyfrowych. Wiele idei, które przyświecały budowaniu Sieci Semantycznej wywodzi się właśnie z tego środowiska; wielu ludzi ściśle związanych z rozwojem Web 3.0 posiadało doświadczenie w pracy nad bibliotekami cyfrowymi. Dziwić więc może, że jeszcze do niedawna oba środowiska nie potrafiły znaleźć wspólnego języka.

Kiedy myślimy o bibliotece na myśl przychodzą nam dwa obrazy: zbiór książek i budynek w którym przechowywany jest ten zbiór. Zdefiniowanie pojęcia biblioteki cyfrowej jest trudniejsze:

  • Czy biblioteki cyfrowe to po prostu katalogi do przeszukiwania zasobów bibliotecznych dostępne przez Internet (ang. Online Public Access Catalog - OPAC) ?
  • Czy może biblioteka cyfrowa to skanowane dzieła, np. starodruki, opublikowane w Internecie ?
  • A może biblioteka cyfrowa to kolekcja zasobów i metadanych dostępna za pomocą przeglądarki Internetowej ?
  • Wreszcie, może biblioteka cyfrowa to sam system informatyczny publikujący kolekcję zasobów w Internecie ?

Dodatkowo biblioteki cyfrowe mogą być rozpatrywane zarówno pod kątem historycznym jak i technologicznym. Możemy też brać pod uwagę różne aspekty ich funkcjonowania: katalogowanie, zarządzanie informacją, wyszukiwanie informacji lub interakcja z użytkownikiem. Jak widać odpowiedź na to pytanie nie jest trywialna. Jeden z Europejskich projektów poświęconych bibliotekom cyfrowym, DELOS (obecnie dl.org), opracował raport, który odpowiada na to i inne pytania. W jednym z następnych artykułów postaram się przybliżyć nieznacznie tę tematykę.

Jak wcześniej wspomniałem wyniki badań w nad bibliotekami cyfrowymi dostarczyły wiele standardów, które są obecnie dość powszechnie stosowane w Internecie. Same jednak biblioteki cyfrowe do niedawna nie były tak na prawdę częścią Internetu. Oferowane przez nie usługi były często niekompatybilne pomiędzy samymi nawet bibliotekami, nie mówiąc już o próbie ich wykorzystania w innych usługach internetowych. Z drugiej strony do nie tak dawna biblioteki cyfrowe całkowicie odrzucały nurt mediów społecznych czy jakiegokolwiek innego sposobu na (niekontrolowane) dostarczanie dodatkowych treści. Dodatkowo słowniki (tezaurusy i taksonomie) utrzymywane przez biblioteki cyfrowe często nie są dostatecznie szybko aktualizowane aby odzwierciedlać obecny stan wiedzy. Nie bez znaczenia pozostaje fakt, że interakcja dostarczana przez biblioteki cyfrowe znacząco odbiega od "standardów" spotykanych w popularnych serwisach, jak choćby Facebook czy Twitter; tym samym nie odpowiada potrzebom i oczekiwaniom użytkowników, szczególnie młodszym pokoleniom.

Celem prac nad Semantycznymi Bibliotekami Cyfrowymi jest doprowadzenie do lepszej integracji pomiędzy bibliotekami i innymi usługami w Internecie, oraz poprawienie satysfakcji użytkowników z korzystania z usług dostarczanych przez biblioteki cyfrowe.



Semantyczne biblioteki cyfrowe są wynikiem połączenia wyników prac badawczych z trzech dziedzin:

  • bibliotek cyfrowych, z głównym wkładem w postaci systemów organizacji wiedzy, słowników, tezaurusów, klasyfikacji, itp.
  • sieci semantycznej zapewniającej znane nam już mechanizmy rozszerzalności opisów i interoperacyjności pomiędzy usługami i opisami,
  • technologii Web 2.0 wprowadzających do świata bibliotecznego społeczne opisywanie zasobów (tagowanie) i społeczności powiązanych użytkowników systemów bibliotecznych.

Część z Was słyszała zapewne o inicjatywie Biblioteki 2.0 (ang. Library 2.0). Chociaż część z założeń jest podobna to jednak pojęcie Biblioteki 2.0 opiera się na 5 elementach: open source, single sign-on (czyli współdzielenie uwierzytelniania), otwarte standardy, zintegrowany OPAC, i oczywiście mediach społecznych. Brakuje więc dwóch istotnych elementów: standardów semantycznych zapewniających rozszerzalność i interoperacyjność, oraz powiązania ze standardami i usługami Internetowymi. Nurt Biblioteki 2.0 jest obecnie bardzo popularny, jednak określanie niektórych systemów bibliotek cyfrowych mianem "semantycznymi" tylko dlatego, że pozwalają użytkownikom na tagowanie jest dużym nadużyciem.

Na zakończenie tej części serii artykułów o Semantycznych Bibliotekach Cyfrowych, chciałbym pokrótce wymienić kilka projektów z nimi związanymi. W najbliższych tygodniach postaram się przybliżyć je bardziej.

  • DuraSpace jest inicjatywą powstałą w ubiegłym roku z połączenia dwóch grup: popularnej biblioteki cyfrowej DSpace oraz Fedora Commons dostarczającej infrastruktury do budowy wydajnych i bogatych w funkcjonalność semantycznych bibliotek cyfrowych.
  • JeromeDL jest projektem prowadzonym przez DERI Galway i Politechnikę Gdańską, z komercyjnym wsparciem ze strony firmy Knowledge Hives; powstał na bazie prototypu semantycznej biblioteki cyfrowej Elvis-DL stworzonego na Politechnice Gdańskiej w 2003 roku. Wokół projektu JeromeDL powstało kilka innych projektów tworzących klaster Corrib.org; w tym m.in., inicjatywa MarcOnt,  które dostarczają usługi, komponenty i ontologie dla semantycznych bibliotek cyfrowych.
  • Greenstone jest kolejnym bardzo popularnym systemem biblioteki cyfrowej, umożliwiającym, m.in, efektywne wykorzystanie informacji o geolokalizacji za pomocą technologii semantycznych.
  • SIMILE jest projektem prowadzonym przez MIT Libraries, który dostarcza szereg komponentów, które umożliwiają łatwe przekształcenie klasycznej biblioteki cyfrowej (lub innej witryny w Sieci) w interaktywny, bogaty w funkcje serwis oparty o technologie semantyczne.
  • BRICKS był projektem prowadzonym w ramach Szóstego Programu Ramowego (FP6) - dostarczył kilka komponentów oraz infrastrukturę umożliwiającą efektywne społeczne i semantyczne opisywanie zasobów bibliotecznych, oraz wymianę pojęć pomiędzy różnymi systemami bibliotecznymi.

Więcej na temat Semantycznych Bibliotek Cyfrowych możecie dowiedzieć się na stronie inicjatywy, gdzie znajdziecie kilkanaście prezentacji (w tym kilkugodzinne tutoriale) oraz opis dwóch książek na ten temat.

Ten artykuł jest również dostępny w języku(ach): angielski, hiszpański, koreański

Komentarze (4) Trackbacks (1)
  1. Długo była cisza, cisza, a teraz jak już coś jest – to konkretnie i rzeczowo! Super! Dzięki bardzo za ten ten wpis. Ten blog to naprawdę nieocenione źródło wiedzy. Pozdrawiam serdecznie.

  2. Informacja Naukowa i Bibliotekoznawstwo – mój kierunek studiów nr1 i Socjologia – nr2. Dzięki za artykuł.

    • No wlasnie – powiedz co macie na studiach ? Bo tak jak juz kiedys wspominalem – na zachodzie ludzie po “Information Science and Library Studies” byli czasami ciezcy do odroznienia od informatykow. Wiele osob ktore poznalem w srodowisku Semantic Web, ktore dokonaly waznych rzeczy (w tym i implementacji), bylo de facto po tych studiach.
      Mam wrazenie – ze tak nie jest w Polsce. Na Politechnice Gdanskiej mialbyc kiedys utworzony taki kierunek, jednak nie powstal. Zas wyklady z bibliotek cyfrowych na wydziale elektroniki to wg mnie za malo – bo to raczej potrzeba bibliotekarza z zacieciem informatycznym, niz informatyka ze szczatkowa wiedza biblioteczka.


Dodaj komentarz

Musisz być zalogowany aby dodać komentarz.