Szkoła Web 3.0 The School of Semantics

3lut/10

Semantyczne Biblioteki Cyfrowe – cz. 1: Wprowadzenie

W czasie swojej pracy naukowej często spotkałem się z raczej mało popularnymi w Polsce studiami poświęconymi informacji i bibliotekom (ang. Information Science and Library Studies). Po części pokrywają się one z tym co można się dowiedzieć na piewszych latach studiów informatycznych w Polsce, jednak są silnie ukierunkowane na zarządzanie informacją, szczególnie w kontekście bibliotek cyfrowych.

Pamiętacie zapewne lekką ontologię Dublin Core, którą omawiałem w październiku zeszłego roku. Jest ona jedną z najstarszych i prawdopodobnie najbardziej popularnych ontologii stosowanych nie tylko w Web 3.0, ale i w szeroko rozumianym Internecie. Być może część z Was już wie, że standard Dublin Core wywodzi się tak na prawdę ze środowiska bibliotekarskiego. Inną ontologią ściśle związaną ze środowiskiem bibliotek cyfrowych jest SKOS, o której też pisałem w zeszłym roku.

Te ontologie, jak i inne standardy powstały właśnie w wyniku badań naukowych prowadzonym w ramach projektów bibliotek cyfrowych. Wiele idei, które przyświecały budowaniu Sieci Semantycznej wywodzi się właśnie z tego środowiska; wielu ludzi ściśle związanych z rozwojem Web 3.0 posiadało doświadczenie w pracy nad bibliotekami cyfrowymi. Dziwić więc może, że jeszcze do niedawna oba środowiska nie potrafiły znaleźć wspólnego języka.

10lis/09

Projekt SIOC: Semantycznie Połączone Społeczności Internetowe

SIOC logoPodczas omawiania języka opisu ontologii OWL Lite, a później w czasie opisu lekkiej ontologii FOAF, wspominaliśmy o SIOC: trzeciej bardzo ważnej lekkiej ontologii z punktu widzenia budowania Web 3.0 i łączenia technologii społecznych z semantycznymi. O ile SKOS umożliwia na opisanie w prosty sposób słowników i taksonomii, a FOAF pozwala nam opisywać zależności pomiędzy członkami sieci społecznej, to właśnie SIOC, czyli ontologia Semanticznie Polączonych Społeczności Internetowych, pozwala na zapis interkcji pomiędzy użytkownikami usług społecznych.

30paź/09

Sieć semantyczna rośnie w siłę dzięki New York Times

Połączone źródła danych i NYT (źródło: New York Times)

W czasie czerwcowej konferencji SemTech 2009, poświęconej zastosowaniom Sieci Semantycznej w przemyśle, New York Times ogłosił, że już niedługo udostępni swoje archiwa w postaci zgodnej ze rekomendacjami na publikowanie danych w Sieci Semantycznej: RDF i Połączone Otwarte Dane (ang. Linked Open Data - LOD), o których napiszemy niedługo. Wczoraj w czasie konferencji ISWC 2009, w czasie sesji o praktycznych zastosowaniach Sieci Semantycznej, Evan Sandhaus z New York Times oficjalnie ogłosił uruchomienie serwisu dostępu do danych New York Times: http://data.nytimes.com/. New York Times publikuje słownik wykorzystywanych kategorii w znanej nam już ontologii SKOS. Aby skorzystać z usługi opublikowanej przez New York Times musimy najpierw zarejestrować się i otrzymać swój klucz dostępu; więcej informacji interesującej dla programistów można znależć pod adresem http://developer.nytimes.com/.

Po Retures z systemem Open Calais, New York Times jest kolejną agencją informacyjną która postanowiła opublikować swoje archiwa w postaci rozumianej przez maszyny. Tego typu serwisy, publikujące otwarte, połączone dane (LOD) są niezmiernie ważne dla dalszego rozwoju Sieci Semantycznej.

19paź/09

Łączymy publiczne słowniki – openvocabulary.info

ovlogo.Plkmx38acld5.jpg

Każdy serwis Web 3.0 potrzebuje dwóch elementów: semantyki i społeczności. Zanim większość Internetu będzie dostępna w postaci grafu

powiązanych semantycznie zasobów i usług sieciowych, musimy przedsięwziąć wszelkie kroki, aby opublikować jak najwięcej istniejących danych w postaci semantyki. Warto zacząć od opublikowania istniejących słowników, tak aby inne zasoby i usługi sieciowe mogły z nich korzystać.

W jednym z poprzednich artykułów opisaliśmy standard SKOS, który umożliwia opis słowników w formacie RDF. W tym artykule przedstawimy projekt Open Vocabulary umożliwiający dostęp do słowników w formacie SKOS. Projekt ten dostarcza bibliotekę programistyczną w języku Java oraz usługę sieciową typu REST.

16paź/09

WordNet – Sieć Słów

W jednym z wcześniejszych wpisów, prezentując lekką ontologię SKOS, wspominaliśmy jak ważne jest używanie wspólnego słownika. Dziś chcielibyśmy Wam pokazać jak taki słownik wygląda na przykładzie projektu WordNet.

12paź/09

Tworzenie prostych słowników w ontologii SKOS

Podstawą funkcjonowania Sieci Semantycznej są dobrze opisane, powiązane pomiędzy sobą i opublikowane dane. Do tej pory poznaliśmy podstawowe rozwiązania umożliwiające opis semantyczny: grafy i schematy RDF, lekką ontologię DublinCore.

Jednym z niezmiernie istotnych elementów opisu semantycznego są słowniki (ang. controlled vocabulary), które dostarczają pojęć wykorzystywanych w opisach semantycznych. Chociaż słowniki, takie jak zarówno tezaurusy czy taksonomie, tworzone są już od długiego czasu, szczególnie w środowisku bibliotekarskim, to jednak nie są one zapisywane w postaci która umożliwiałaby ich wykorzystanie w Internecie; szczególnie w grafach RDF. Odpowiedzią na te wymagania jest format tworzenia prostych systemów organizacji wiedzy - SKOS (ang. Simple Knowledge Organization Systems).

8paź/09

Lekkie ontologie

Znamy już podstawowy język opisu ontologii, jakim jest RDF Schema. Czas aby zapoznać się z kilkoma lekkimi ontologiami (ang. lightweight ontology), używanymi powszechnie w różnych rozwiązaniach semantycznych.