Dlaczego Taksonomia to nie Ontologia ?
Odpowiedź na to pytanie przez wiele lat wydawało mi się całkiem oczywista. Kiedy w 2007 roku, w czasie naszego tutoriala o Semantycznych Bibliotekach Cyfrowych w czasie konferencji WWW (w nawiązaniu do slajdu 24), ktoś poprosił nas o dokładne wyjaśnienie różnic, okazało się, że zdefiniowanie odpowiedzi w sposób jednoznaczny nie było takie proste; po kilku latach pracy w tematyce Sieci Semantycznej i bibliotek cyfrowych - niektóre pojęcia przyjmuje się jak aksjomaty.
Ponieważ temat wypłynął niedawno na forum Biblioteka 2.0, postanowiłem zmierzyć się z tym pytaniem.
Niecały miesiąc po wspomnianym tutorialu na konferencji WWW, prezentowaliśmy tematykę Semantycznych Bibliotek Cyfrowych na konferencji ESWC2007. Tym razem postanowiliśmy odpowiedzieć na to pytanie od razu w czasie prezentacji:
Podstawowymi 3 pojęciami, które musimy rozróżniać to: taksonomia (ang. taxonomy), tezaurus (ang. thesaurus) i ontologia (ang. ontology). Wszystkie mają przynajmniej jedną cechę wspólną: są stałą kolekcją pojęć, tzn. że nie można dowolnie i samodzielnie dodawać do nich nowych pojęć tak jak to ma miejsce w przypadku tagów. Nie oznacza to, że są one całkowicie niezmienne, a jedynie to, że ich dynamika zmian jest dużo wolniejsza.
Zacznijmy od taksonomii: najprościej rzecz ujmując jest to kolekcja pojęć pomiędzy, którymi zostały określone relacje tworzące hierarchię tych pojęć. Zazwyczaj mówimy o zawężaniu i poszerzaniu znaczenia pomiędzy pojęciami w hierarchii; tak też nazywają się predykaty wprowadzone w SKOS, odpowiednio skos:narrower i skos:broader.
Tezaurus jest kolekcją pojęć pomiędzy, którymi występują nie tylko relacje tworzące hierarchię tych pojęć, ale również dodatkowe relacje znaczeniowe (semantyczne). W przypadku tezaurusów w stylu WordNet, dodatkowymi relacjami mogą być określenia synonimów, homonimów, itp.
Czym więc jest sama ontologia? Pojęcia które są w niej zdefiniowane za pomocą formalnego języka definicji ontologii (np. OWL), pozwalają na nadanie znaczenia innym pojęciom w konkretnej dziedzinie wiedzy. Czyli zarówno w tezaurusie jak i ontologii używamy zestawu meta-pojęć, które tworzą relacje pomiędzy pojęciami z danej kolekcji; w przypadku tezaurusa pojęcia te definiujemy wraz z danym tezaurusem lub używamy standardów w stylu SKOS, zaś w przypadku ontologii używamy formalnych języków w stylu OWL. Różnica jest o tyle znacząca, że pojęcia wprowadzane w formalnych językach typu OWL mają nie tylko konkretne znaczenie, ale co więcej implikują znaczenie na pojęciach, które opisują. Najważniejsze jest jednak to, że tezaurusy czy taksonomie wykorzystujemy jako słowniki pojęć z relacjami pomiędzy nimi. W przypadku ontologii, pojęcia w niej zdefiniowane służą nam do tego aby nadawać znaczenie pojęciom z jakiegoś obszaru wiedzy.
Jak łatwo poznać, że taksonomia czy tezaurus to nie ontologia ? Bo do tego, żeby stworzyć taksonomię czy tezaurus potrzebujemy metasłownika relacji dostępnych w danej taksonomii czy tezaurusie, takiego jak np. SKOS. Z drugiej zaś strony wiemy, że SKOS jest lekką ontologią. Tym samym ontologie i tezaurusy/taksonomie istnieją na dwóch różnych poziomach "abstrakcji".
Zdaję sobie sprawę, że być może nadal część z was nie do końca rozumie różnicę, ale mam nadzieję, że szczególnie ostatni akapit pozwoli dostrzec znaczące szczegóły pomiędzy ontologią a tezaurusami i taksonomiami.
[Aktualizacja w odpowiedzi na pytanie]
Tom Gruber (niekwestionowany autorytet w sprawach ontologii), kiedyś stwierdził, że ontologie są często przyrównywane do taksonomicznej hierarchii klas, ich definicji i relacji zawierania; jednak ontologie nie mogą być ograniczone do tych form. Ontologie nie mogą być również ograniczone konserwatywnymi definicjami, które jedynie wprowadzają terminologię ale nie wprowadzają żadnej wiedzy o otaczającym świecie.
O ile więc można przyjąć, że ontologia zawiera elementy taksonomiczne, bo mamy hierarchię klas czy właściwości, to
- taksonomia dotyczy bardziej konkretnych pojęć z ontologii a nie całej ontologii
- ontologia będzie nadal ontologią bez hierarchii klas czy właściwości; a czy taksonomia nie pozostanie taksonomią bez hierarchii konceptów ?
- i jeszcze raz powtórzę: należy patrzeć na to do czego służy ontologia a do czego taksonomia; ta pierwsza pozwala nam modelować świat w sposób formalny, taksonomia - może być użyta do tego aby klasyfikować lub opisać, ale nie modelować



Luty 12th, 2010 - 18:11
Kolega (via Facebook) zasugerował ciekawy artykuł http://www.emeraldinsight.com/10.1108/00220410310457984. Jak tylko go przeanalizuję to zaktualizuję powyższy artykuł.
Luty 15th, 2010 - 17:38
“taxonomy – a collection of controlled vocabulary terms organized into a hierarchical structure
formal ontology – a controlled vocabulary expressed in an ontology representation language
this language has a grammar for using vocabulary terms to express something meaningful with a specified domain of interest ”
Skoro ontologia nie jest taksonomią, to analizując obie powyższe definicje literalnie – słowo po słowie trzeba dojść do wniosku że ontologia nie jest zorganizowana w strukturę hierarchiczną, tzn że nie posiada relacji hiperonimii, co nie jest prawdą. Więc albo ontologia jest taksonomią albo ich definicje są nieścisłe. Czy dobrze myślę?
Może lepiej powiedzieć że ontologia jest taksonomią, ale nie tylko zawiera listę słów ale co najważniejsze definiuje pojęcia przez nie nazywane itd.?
Luty 15th, 2010 - 19:43
Wiesz, przeczytaj artykuł jeszcze raz, a potem swoje komentarze.
Ja napisałem ze taksonomia nie jest ontologia, a Ty dowodzisz ze ontologia może być uznana za taksonomię.
Ale Twoje zdanie nie dowodzi, że taksonomia jest ontologią.
Reszta odpowiedzi w drugiej części postu.
Luty 15th, 2010 - 21:33
1. Widze ze doszlo do nieporozumienia. Url: “www.semanticschool.com/2010/02/ontologia-to-nie-taksonomia/” i tytuł “Dlaczego taksonomia to nie ontologia” wprowadzają w błąd. Zalozylem po cichu ze artykul dotyczy tego ze ontologia nie jest hiponimem taksonomii. Gdyż to ze taksonomia nie jest hiponimem ontologii jest oczywiste. Artykul nie dotyczy pierwszego, drugie jest oczywiste wiec po co pisac o tym artykul. Z tego co rozumiem to artykul dotyczy tego ze “ontologia to pojecie z innego obszaru wiedzy niz taksonomia i dlatego nie istnieje miedzy nimi relacja hiperonimii”.
2. Czy można zdefiniować pojęcie w taki sposób ze z definicji nie będzie jawnie wynikała relacja hiperonimii?
Np. z definicji pojecia “Pies domowy” za Wikipedią:
“Pies domowy to drapieżny ssak z rodziny psowatych, udomowiony przez człowieka potomek wilka szarego”
wynika jawnie hiperonimia: “Pies domowy” – “rodzina psowatych” (oraz nadmiarowo “Pies domowy” – “ssak”).
Drugie pytanie czy nawet jeśli można w pewnym praktycznie istniejacym jezyku ontologii takie definicje tworzyć to czy w tej samej ontologii nie mozna wywnioskowac hiperonimii?
Jesli zawsze bylaby mozliwosc wywnioskwania ontologii to oznaczaloby to ze każda ontologia jest w praktyce taksonomią (albo i teoretycznie)?
Luty 15th, 2010 - 21:35
W ostatnim zdaniu miało być “możliwość wywnioskowania hiperonimii”