Semantyczny tort: jak przełknąć wizję Web 3.0
We wczorajszym artykule przedstawiłem historię narodzin i rozwoju Web 3.0. Nie ma co ukrywać, że do jej pełnego spopularyzowania jeszcze trochę brakuje. Można by długo rozprawiać co się stało, że po 20 latach od powstania Internetu nadal nie wygląda on w pełni tak jak go wymyślił sir Tim Berners-Lee (na zdjęciu poniżej).
Jednym ze sposobów na przedstawienie wizji rozwoju Web 3.0, a dokładniej Sieci Semantycznej, jest analiza tzw. semantycznego tortu (ang. Semantic Web Layer Cake), który przedstawia stos technologii i standardów potrzebnych do stworzenia w pełni funkcjonalnej Sieci Semantycznej. Jedna z jego pierwszych wersji (prezentowana w 2002 roku przez TBL) była następująca:
Podstawą Sieci Semantycznej są dwie technologie, dzięki którym możliwe jest wskazanie dowolnej treści i obiektu (nie tylko w Internecie) oraz opisanie ich w dowolnym języku; są to odpowiednio URI (Uniform Resource Identifier) i Unicode. Adres URI jest podobny do adresu URL (Uniform Resource Locator), z którym mamy codziennie do czynienia w Internecie; różni go jednak to iż umożliwia (przynajmniej teoretycznie) na wskazanie nawet przedmiotów w świecie rzeczywistym, a zatem również ich opisanie i połączenie z dokumentami w Internecie. Unicode umożliwia zapis znaków ze wszystkich znanych obecnie alfabetów.
Kolejna warstwa to bardzo popularny obecnie standard XML i związane z nim przestrzenie nazw (ang. namespaces). W XMLu można zapisać informacje tak, aby maszyna mogła je przetworzyć (ale nie zrozumieć!). W jednym z przyszłych artykułów postaramy się wyjaśnić dlaczego wprowadzenie warstwy XML do "semantycznego tortu" nie było najlepszym pomysłem.
Warstwę wyżej zdefiniowany jest standard nieodłącznie związany z Siecią Semantyczna: RDF (Resource Description Framework). W odróżnieniu od XMLa umożliwia on na zapis grafu (skierowanego) w postaci przetwarzanej przez maszyny; m.in. właśnie na bazie informacji zapisanych w grafie powiązań znaczeniowych (tj. semantycznych) maszyny mogą podjąć próbę zrozumienia prezentowanej treści. Aby wspomóc proces "rozumienia" informacji zapisanej w RDF, kolejne dwie warstwy związane są z definiowaniem znaczenia pojęć wykorzystanych w opisie grafu RDF. Tak zgadliście: chodzi o okryte złą sławą ontologie (o tym w jednym z następnych odcinków serialu). RDF Schema umożliwia na definiowanie prostych ontologii za pomocą hierarchii klas (ang. class) i właściwości (ang. property); nie, tym razem nie ma to nic wspólnego z programowaniem obiektowym poza samą nazwą. Omówimy ten problem w osobnym artykule.
Kolejna warstwa, czyli reguły (ang. rules), pozwala na definiowanie (w językach formalnych, np. RIF) reguł przetwarzania wiedzy zapisanej w RDF i ontologiach. W zestawieniu z budowanymi obecnie mechanizmami struktur logicznych (ang. logic framework) umożliwią maszynom zrozumienie informacji, a nie tylko jej przetwarzanie.
Ostatnie dwie warstwy konieczne są do zapewnienia maszynom (pewnej) autonomiczności w przetwarzaniu informacji i podejmowaniu decyzji w imieniu ich właścicieli. Wymaga to jednak możliwości dostarczenia formalnych dowodów (ang. proof) na poprawność wysuniętych wniosków, oraz ustalenia poziomu zaufania do przeprowadzonego procesu wnioskowania (ang. trust).
Pozostałe dwa elementy, podpisy cyfrowe (ang. signature) i szyfrowanie (ang. encryption), zapewniają bezpieczeństwo operacji w Sieci Semantycznej.
Uff, dużo tego, a co gorsza - same suche specyfikacje, rekomendacje, standardy. Całe szczęście w ciągu ostatnich lat udało się zmienić tę wizję chociaż częściowo w rzeczywistość.
W ciągu ostatnich lat "semantyczny tort" ewoluował wraz z implementacją kolejnych jego warstw. Już dwa lata póżniej, TBL dodał dodatkową warstwę: zapytań (ang. queries) i schematów XML. Pojawiły się też pierwsze narzędzia (Annotea), słowniki (P3P, CC/PP) i standardy (Dublin Core, RSS) implementujące dolne warstwy tortu:

Kolejna wersja semantycznego tortu (rok 2004) http://www.w3.org/2004/Talks/0412-RDF-functions/slide4-0.html
Obecna wersja "semantycznego tortu" zawiera przede wszystkim specyfikacje, które stały się standardami implementującymi poszczególne warstwy: OWL (Web Ontology Language), RIF (Rule Interchange Format), SPARQL (język zapytań dla RDF). Istotne jest, że ontologie, reguły i logika stały się de facto jedną warstwą. Ograniczone też zostało znaczenie formatu XML, bo tak na prawdę w Sieci Semantycznej można radzić sobie bez ograniczeń wprowadzonych przez XML. Pojawiła się też nowa warstwa "docelowa" - interfejs użytkownika (ang. user interface) i aplikacje. Dodatkowo, wskazywanie obiektów możliwe jest teraz za pomocą standardu IRI (Internationalized Resource Identifier) rozszerzającego URI o możliwość używania znaków spoza standardu ASCII do zapisu identyfikatora obiektu.
Do niedawna cały nacisk na prace nad Siecią Semantyczną skierowany był na rozumienie znaczenia treści przez maszyny. To m.in. sukces Web 2.0 spowodował, że zrozumiano potrzebę i ogromne znaczenie interakcji użytkowników z systemami opartymi o rozwiązania semantyczne.
Na zakończenie, wisienka na torcie (ang. cherry on the cake): wersja 3D semantycznego tortu przygotowana przez Benjamina Nowacka. To co w niej istotne to najnowszy element zestawu technologii semantycznych: powiązane dane (ang. linked data). Nie ma co ukrywać, że są one niezmiernie ważne dla sukcesu Web 3.0: bez semantycznych (czyt. powiązanych) danych, dostępnych w dużej mierze publicznie, żadne mechanizmy wnioskowania nie będą miały znaczenia.

Semantyczny tort w wersji 3D wraz z powiązanymi danymi http://bnode.org/blog/2009/07/08/the-semantic-web-not-a-piece-of-cake
Ten artykuł jest również dostępny w języku(ach): angielski, hiszpański, koreański
Enjoy this article?
Książki

Tagi
Reklama
Categories
- Badania i rozwój (7)
- Informacje (17)
- Konferencje (1)
- Książki (1)
- Nowości (2)
- Szkolenia (3)
- Wiadomości (7)
- Szkoła (44)
- Dla managerów (3)
- Dla programistów (22)
- Podstawy (33)
- Technologie (16)
- Biblioteki (3)
- Ontologie (10)
- Usługi Semantyczne (5)
Recent Posts
- Web 3.0 w teorii i praktyce – prezentacja na InfoShare 2010
- Przyszłość Sieci Semantycznej
- Web 3.0: dlaczego, jak, krytyka, schizmy, i przyszłość
- Prezentacja: Sieć Semantyczna w teorii i w praktyce [InfoShare 2010]
- Nowa Książka: Wzorce Projektowe Linked Data
Dodatkowe źródła
Inne
Archives
- Maj 2010 (4)
- Kwiecień 2010 (2)
- Luty 2010 (8)
- Grudzień 2009 (6)
- Listopad 2009 (6)
- Październik 2009 (19)
- Wrzesień 2009 (6)


![Reblog this post [with Zemanta]](http://img.zemanta.com/reblog_e.png?x-id=65f4bb70-69e5-43a9-bf2a-7ec4318fe923)
