RDF: tłumaczył człowiek maszynie
Od kiedy człowiek stworzył pierwszą maszynę, tak długo pewnie marzeniem (i horrorem) była chęć rozumienia nas przez maszyny. Jeżeli czytając o historii Web 3.0 podążyliście za wskazaniem do słynnego artykułu sir Tima Bernersa-Lee to zwróciliście pewnie uwagę na stronę tytułową tego wydania Scientific American - ekran komputera ze słowami: "Wiem co masz na myśli" (I know what you mean):
O ile lata sukcesów i porażek badań nad Sztuczną Inteligencją (ang. Artificial Intelligence) przyniosły bardziej złą sławę niż konkretne rezultaty, to należy pamiętać, że ludzie pracujący nad Siecią Semantyczną odcinają się od sztucznej inteligencji, proponując w zamian dość radykalnie różne podejście: przetwarzanie znaczeniowe a nie numeryczne.
Oczywiście wymaga to również odmiennego sposobu reprezentacji informacji: jest nią RDF (Resource Description Framework). Zanim omówimy czym jest RDF, małe ćwiczenie: postarajcie się opisać krzesło (np. z obrazka poniżej) używając do tego jak najprostszych zdań.

Krzesło: jak je opiszesz?
I jak? Udało się? Oto kilka zdań które mi przyszły do głowy:
- To jest krzesło.
- Jest zrobione z drewna i skóry.
- Posiada oparcie i nogi.
- Ma cztery nogi.
- Służy do siedzenia.
- Wykonane jest przez stolarza.
Możemy też dalej rozszerzać nasz opis:
- Stolarz wykonuje krzesła.
- Mężczyzna siedzi na krześle.
- Stolarz i mężczyzna są ludźmi.
I oczywiście moglibyśmy kontynuować nasz opis w nieskończoność. To co powstaje w naszej głowie to mapa myśli (ang. mind map). Jeżeli pominiemy restrykcje i wytyczne narzucone przez technikę tworzenia map myśli, to nasz opis krzesła możemy przedstawić następująco.

Pojęcie "krzesło" opisane jako mapa myśli
Tym samym stworzyliśmy nasz pierwszy opis w RDF.
Jak to możliwe? Otóż RDF jest właśnie językiem reprezentacji informacji zapisanej w grafie (skierowanym). Każde proste zdanie (w języku naturalnym) odpowiada jednej krawędzi w grafie, tj. wyróżniamy 3 elementy każdego zdania RDF (ang. RDF statement):
- podmiot (ang. subject) to wierzchołek, czyli zasób (ang. resource), w którym zaczyna się dana krawędź,
- predykat (ang. predicate) nazywa daną krawędź w grafie,
- obiekt (ang. object) to drugi wierzchołek, zasób lub literał (ang. literal), w którym kończy się dana krawędź.
Na przykład nasze zdania możemy zapisać następująco, wyróżniając poszczególne elementy zdania RDF:
- [Krzesło] [posiada] [oparcie].
- [Krzesło] [służy do] [siedzenia].
- [Krzesło] [wykonane jest przez] [stolarza].
- [Stolarz] [wykonuje] [krzesła].
- [Mężczyzna] [siedzi na] [krześle].
Jest jednak kilka zdań, których zapis nie jest aż tak oczywisty.
- "Jest zrobione z drewna i skóry" - możemy zapisać jako dwa zdania:
- [Krzesło] [jest zrobione z] [drewna].
- [Krzesło] [jest zrobione ze] [skóry].
- "Posiada cztery nogi." - tutaj ujawnia się ciekawa właściwość RDF, tzw. reifikacja (ang. reification), czyli wypowiadanie zdania o zdaniu. W tym przypadku będzimy potrzebowali dwóch zdań RDF do zapisania tego przykładu (tak naprawdę będziemy potrzebowali aż 6 zdań, ale o tym w jednym z kolejnych artykułów):
- [Krzesło] [ma] [nogi].
- [W powyższym zdaniu] [jest nóg sztuk] "4".
- Zadania z "to jest" wymagają specjalnego predykatu do określenia klasy, tzn. typu, opisywanego zasobu. Ten predykat to "rdf:type" i jest jednym z istotnych elementów opisu RDF (więcej na ten temat niedługo):
- [Nasze krzesło] [rdf:type] [Krzesło].
- [Nasz mężczyzna] [rdf:type] [Człowiek].
- [Nasz stolarz] [rdf:type] [Człowiek].
Chociaż nie potrafimy jeszcze zapisać formalnie opisu RDF (o tym w artykule o sposobach reprezentacji grafu RDF), to na zakończenie warto zapamiętać jeszcze kilka (trochę technicznych informacji, więc nie przejmujcie się jeżeli wrócimy do nich w najbliższych artykułach).
W grafie RDF występują dwa typy wierzchołków: zasoby (ang. resource) i literały (ang. literal). Zasoby są identyfikowane przez URI (patrz artykuł o semantycznym torcie), i mogą być początkiem, jak i końcem krawędzi w grafie; sama krawędź jest również identyfikowana przez URI. Literały są ciągami znaków, liczbami, datami, itp., i tym samym mogą być jedynie końcowym wierzchołkiem krawędzi.
RDF definiuje jeszcze jeden specjalny typ wierzchołka: tzw. nienazwany wierzchołek (ang. blank node). Nienazwane wierzchołki nie mogą być identyfikowane poza systemem, który przechowuje informacje o grafie. Możemy użyć ich do reprezentacji wierzchołków grafu, ale nie do reprezentacji jego krawędzi. Do nienazwanych wierzchołków jeszcze wrócimy, ale zapamiętajcie, że należy ich unikać ze wszystkich sił.
Ten artykuł jest również dostępny w języku(ach): angielski
Enjoy this article?
Książki

Tagi
Reklama
Categories
- Badania i rozwój (7)
- Informacje (17)
- Konferencje (1)
- Książki (1)
- Nowości (2)
- Szkolenia (3)
- Wiadomości (7)
- Szkoła (44)
- Dla managerów (3)
- Dla programistów (22)
- Podstawy (33)
- Technologie (16)
- Biblioteki (3)
- Ontologie (10)
- Usługi Semantyczne (5)
Recent Posts
- Web 3.0 w teorii i praktyce – prezentacja na InfoShare 2010
- Przyszłość Sieci Semantycznej
- Web 3.0: dlaczego, jak, krytyka, schizmy, i przyszłość
- Prezentacja: Sieć Semantyczna w teorii i w praktyce [InfoShare 2010]
- Nowa Książka: Wzorce Projektowe Linked Data
Dodatkowe źródła
Inne
Archives
- Maj 2010 (4)
- Kwiecień 2010 (2)
- Luty 2010 (8)
- Grudzień 2009 (6)
- Listopad 2009 (6)
- Październik 2009 (19)
- Wrzesień 2009 (6)

![Reblog this post [with Zemanta]](http://img.zemanta.com/reblog_e.png?x-id=39e80abc-631e-408d-b9b0-aecaa7928436)

Wrzesień 28th, 2009 - 15:38
Mam nadzieję, że czytelnicy tej witryny docenią wkład autorów, bo czyta się Was lekko i przyjemnie, w dodatku po polsku. Samodzielne dochodzenie do zawartych w artykułach wniosków jest czasochłonne i wymaga studiowania obcej technicznej literatury oraz dostępu do najnowszych publikacji z zakresu semantyki(niedostępnej dla zwykłego śmiertelnika). Tutaj wszystko wyjaśnione jest od podstaw – czarne na białym. 3mam kciuki i śledzę, bo warto.
Wrzesień 28th, 2009 - 18:42
Dzięki Macieju, taki też jest zamysł tego bloga. Jeżeli mogę o coś jeszcze prosić to “wykopywanie” i każde inne rozgłaszanie informacji o naszych artykułach. Dzięki.