The School of Semantics Learning Semantic Web Techniques

6cze/11Off

Konferencja SemTech 2011 – jak wykorzystać Sieć Semantyczną w przemyśle

SemTech 2011Wczoraj rozpoczęła się jedną z najważniejszych, corocznych konferencji poświęconych Sieci Semantycznej - SemTech 2011.

Prezentujemy się na SemTech 2011

Jedną z kluczowych cech SemTech jest grupa odbiorców. SemTech w odróżnieniu od innych ważnych konferencji dotyczących Sieci Semantycznej, np. ISWC czy WWW, skierowany jest do praktyków, firm i szeroko rozumianych ludzi biznesu zainteresowanych wdrożeniem Sieci Semantycznej w ich firmach lub prezentujących własne rozwiązania.

Nasza firma, Knowledge Hives, została zaproszona do zaprezentowania w czasie tej konferencji jednej z naszych technologii (o której mam nadzieję napiszemy za jakiś czas). Z tej okazji postanowiliśmy, że będziemy na łamach Szkoły Web 3.0 opisywać co się dzieje na konferencji

14maj/10Off

Web 3.0 w teorii i praktyce – prezentacja na InfoShare 2010

W czasie dzisiejszej konferencji InfoShare 2010 w Gdansku miałem przyjemność opowiedzieć o Web 3.0.

Zainspirowany innymi prezentacjami na InfoShare (tzn. tymi ciekawymi) postanowiłem przerobić swoje slajdy praktycznie w ostatnim momencie. Patrząc na komentarze na blip, chyba nie był to tak głupi pomysł.

Jak widać tematyka wypłynęła nawet na tak popularnym w Polsce blogu jak antyweb.

Zostałem więc z dwoma zestawami slajdów, jednym który pokazałem a drugim z wystarczającą ilością tekstu aby posłużyć jako komentarz do pierwszego.  Oto one:

Web 3.0 w teorii i praktyce (wersja obrazkowa, wygłoszona)

Sieć Semantyczna w teorii i praktyce (wersja z dużą ilością tekstu)

2lis/10Off

The future of the Semantic Web

Pew 연구센터는 최근 2009년 12월부터 2010년 1월까지 총 859 명의 정보기술/인터넷 전문가들의 설문조사를 통해 2020년 웹의 형태에 대한  보고서를 발행했습니다. 참가자들은 팀 버너스 리가 제안했던 웹 3.0의 더 진보된 개발과 현 상태에 대한 그들의 의견에 대해10개의 질문에 응답했습니다.

비평가들은 우리 인간의 커뮤니케이션이 의미하는 것(semantics)은 쉽게 기계에 의해서 해석되지 않는 다고 주장합니다. 왜냐면 우리는 비논리적이고, 농담섞인, 오해의 여지가 있는, 잘못되거나 규칙에 어긋난 표현들로 우리의 생각을 표현하기 때문입니다.  하지만 우리 인간은 특별한 노력없이도 항상 말하는 요점을 정확히 알 수 있다는 점에서는 그렇지 않을 수도 있습니다. 필자는 시멘틱 웹의 미래에 관해 가장 흥미로운 몇 가지 사실들을 모아서 위의 보고서에 대한 내용을 요약하고자 합니다.

시멘틱 웹에 대한 아이디어는 훌륭하지만, 사람과 경제적 경쟁 사이의 많은 변수를 고려했을 너무 고비용인 것처럼 보입니다.

어떤 참가자들은 비영어권 웹에서 시멘틱 웹이 완전히 알려질지 의문을 제기합니다. 디지털 도서관 분야에서는 완전한 시멘틱 기술보다는 지식관리시스템이 더 효과적일 수 있습니다. 또 다른 사람들은 웹 페이지에 더 많은 메타데이터를 입력하려던 이전의 노력들이 잘 이루어지지 않았고, 잘 만들어진 HTML을 찾기 힘든 상황에서 RDF, OWL, Micro-format에 대해서 논의하는 것은 어려운 일이라는 것을 상기시킵니다.

또한 어떤 사람들은 잘못된 데이터와 신뢰 문제에 대해 우려를 표합니다. 여러분들 중 몇몇은 아마도 구글이 이들을 색인하지 않을 정도로 출판자들이 <meta> 태그에 정확한 메타데이터를 넣는다고 믿지 않는다는 것을 기억할지도 모릅니다. 틀린 데이터와 신뢰는 제가 시멘틱 웹을 전도하기 시작한 이래로 지난 10년 동안 제가 받아온 문제/이슈들 중의 하나입니다. 우리는 잘못된 메타데이터를 너무 많이 보아서, 사람들이 시멘틱을 공정하게 다룰 것 이라고 믿지 않습니다. 바로 이것이 시메틱 레이어 케익의 상위 레이가 데이터와 추론(reasoning)의 정확성을 증명하도록 되어있는 이유입니다. 하지만 이것들은 상위 레이어, 우리는 아직도 그 곳으로의 절반쯤 되는 어딘가에 있습니다. 그래서 많은 사람들이 2020년까지 시멘틱 웹이 완전히 가동된다는 것에 이의를 제기하는 것은 놀라운 일이 아닙니다.

어떤 사람들은 시멘틱 웹을 개발하는 것이 실세계(the real world)에 영향을 끼치기 까지 위해 너무 많은 조율과 에너지를 필요로 하고, 막대한 비용이 들기는 하지만, 시멘틱 웹을 만드는 데 들어가는 노력으로 의미있고, 웹 콘텐츠가 상호운용이 가능하도록 하고, 웹 생태시스템(Web Ecosystem)을 잘 이해하는 것과 같은 긍정적인 결과를 기대할 수 있다고 합니다.

많은 사람들은 시멘틱 웹이 진행되어, 우리를 정보의 시대에서 (the age of information) 지식의 시대(the age of knowledge) 안내해줄 것이라고, 이것이 혁신과 개발을 이끌 것이라고 믿습니다.
어떤 사람들은 시멘틱 웹이 성공하면, Semantic Web이 성공하면 그 존재를 거의 인식하지 못할 것이라고 믿습니다. 제 생각에는 이것은 인공지능(AI)와 같습니다. 우리는 AI가 진행되지 않았다고 말하는 경향이 있는데, 동시에 이것은 매일 그늘에서 우리를 돕습니다. 하지만, 시멘틱 웹을 최대한으로 활용하기 위해서 우리는 이것을 더 잘 이해할 수 있는 새로운 과학 즉, 웹 사이언스(Web Science)가 필요합니다. 더 못한 경우, 시멘틱 웹(Semantic Web)은 2020년도에 여전히 걸음마단계(a healthy toddler) 일 겁니다.

시멘틱 웹의 발전에 대해 반대도 있지만 협력하기 위한 강력한 장려책들 또한 있습니다. TBL은 개별 사이트들에 대한 단순히 더 나은 정보 검색보다는 더 원대한 비전을 가지고 있습니다. 그는 다음 10년 동안 이루어질 웹의 발전에 중요한 역할을 수행할 것입니다.

Semantic Web 같은 변화는 불가피합니다. 하지만 이러한 변화는 임의적인 계층적/표면적 표준으로써가 아니라, 근간(기본, grassroots) 주도하여야 합니다.

메타 웹(meta-web)의 다음 세대는 필연적으로 도래할 것입니다. 2020년까지 웹은 오늘보다 점점 더 의미적으로 변화할 것입니다. 새로운 솔루션들이 모습을 드러낼 것이고, TBL과 같은 시멘틱 웹 전통파에 의해서 제안된 들보다는 그들 자신의 표준을 계속 따를 것입니다. 이러한 표준은 정보를 생성하는 과정에서 인적요소를 활용하는 어려움을 고려할 필요가 있습니다. Google (Rich Snippets)과 Facebook (Open Graph)의 최근 노력들은 W3C 표준과 언제나 알맞지는 않다는 것과 어떤 변화/적용이 제안되고 있다는 것을 보여줍니다. SOAP과 XML-RPC와 같은 무거운 접근법들이 REST-Ful 인터페이스에 의해 상향식으로 대체되는 것과 같은 유사한 일이 일어났습니다. 여전히 웹은 의미기반의 연결(semantic links)가 표준이 되기 전까지 가야 할 길이 멉니다.

Semantic Web은 일어날 일이지만, 적절한 응용 소프트웨어(killer app)를 찾아낼 때 까지는 미지수 입니다. 아마도 다음 10년 동안에는 불가능할지도 모릅니다.

Semantic Web은 10년 보다 더 길게 걸릴지도 모르는 중요한(상당한) 행동적 변화가 필요합니다. 우리는 우리 모두가 찾는 뭔가를 발명할 누군가가 필요합니다. 특히 CIA Fact Book, DBPedia, FOAF 등과 같은 서비스에서 온 서로 연결된 구조의 the GGG (Giant Global Graph)를 가지고 있을 때나 가지게 될 때에, 차세대 킬러 앱은 아마도 대화형 검색(conversational search)일 것입니다.

우리는 시멘틱 웹을 만들어내기 위해 인간에 의해 생성되는 혼란스럽고 복잡한 정보를 예비적으로 처리할 있는 기계(machines) 필요로 것입니다.

의도적인Turing(튜링, 기계가 생각하고 있는가)을 할 수 있는 컴퓨터 없이는, 시멘틱 웹은 다루기에 매우 어려운 문제처럼 보입니다. 하지만 우리가 그것을 가지게 되었을 때에는, 사람들은 검색 결과에 대한 불평 외에 그것을 알아채지 못할 것입니다. 따라서 시멘틱 웹의 아카이빙은 분명한 이득은 보통 이용자들에게 명백할 것입니다.

사람을 이해하기 위해 기계가 필요로 하는 시멘틱 웹의 AI 요소는 많은 희망적인 것들을 보장하지는 않습니다.

나 자신을 포함한 많은 사람들은 특히 우리가 우리 자신을 텍스트 집적(the text corpus) 만으로 제한할 때에, 정보에서 자동적으로 의미를 추출하는 것으로 얼마나 많은 것이 이루어질 수 있는가에 대해 매우 냉소적입니다. 이것은 한 아이가 대화의 일 부분만 듣고 자신의 부모들이 나누는 대화를 이해하려고 애쓰는 것과 같습니다. 이것은 때때로 아이가 이해하지 “않아야 하는” 구절에서는 심지어 일부러 가려지기(is veiled)도 합니다. 필시 10년 후에도 사람들은 여전히 비구조적이고, 반구조적인(semi-structured) 데이터로 계속 일하고 있을 것입니다. 시멘틱 기술들의 수용과 사용의 품질은 그것이 취하는 방식에 따라 다양할 수 있습니다. 시멘틱 웹은 특정한 영역 에서는 유용하다고 증명될지도 모르지만, TBL에 의해 제시된(그려진) 완전한 잠재력/가능성까지 발전하지는 않을 것이다. 특별한 이용자는 시멘틱 웹을 더욱 이용할 것 같습니다. 시멘틱 웹은 꼭 AI와 같을 것입니다–언제나 이론상으로는 구석 뒤에 있고 실제로는 기대에 못 미칩니다.

어떤 사람들은 보다 접근이 용이한 정보 저장소, 시멘틱은 웹 언어의 일부가 되기 보다는 애플리케이션 속에 속하게 될 것이라고 생각합니다. 저는 그렇게 생각하지 않습니다. 우리는 이미 애플리케이션에 "의미 "를 가지고 있고, 정말로 없는 것은 예를 들면 웹과 같은 연결(links) 요소입니다.

만약 우리가 사이트나 데이터베이스를 만드는 사람들이 책을 정리할 때처럼 정보표준과 같은 규칙을 그대로 활용할 것이라고 추정한다면, 시멘틱 웹을 향한 중대한 진전/진척이 이루어질 것입니다. 그러나, 많은 요인/인자들은 길을 막고 서있는 것 같습니다(훼방을 놓고 있는 것 같습니다). 성공의 측정은 정의에 많이 의존합니다. 어떤 사람들은 시멘틱 웹을 웹을 위한 최적화된 디자인 원칙으로써 바라봅니다. 만약 여러분이 Pedantic Web에 대한 우리의 기사를 기억한다면, 웹을 “치료한다”는 것을 대부분 이해하게 될 것입니다.

다른 응답자들은 시멘틱 표준이 데이터 이동성(data portability) 상호운용성(interoperability) 향상하는 수행한 역할에 대해 언급했습니다.

어떤 사람들은 2020년까지 상호운용 가능한 컴퓨터 프로그램을 위한 매커니즘이 애플리케이션을 간에 용이하고 눈에 보이지 않는 정보의 공유를 가능하게 할 것이라고 주장합니다. 넓은 의미에서 시멘틱 웹은 인간을 이해하는 기계에 대한 것입니다. 하지만 이 개념의 세부 사항들은 시간이 흐르면서 기술과 사회 경제적 변화를 따라 발달합니다. 우리가 더 많은 컴퓨팅 파워를 가질 때, 더 많은 데이터들이 고 품질의 메타데이터 해석 정보의 조각보다 나을 것입니다. 어떤 응답자들은 시멘틱 웹이 “달성될 수 있는” 어떤 실제적인 “것”이 아니라 “하나의 방법/방식”이라고 주장합니다.

시멘틱 웹은 제공되고 있는 새로운 애플리케이션 에 이미 영향을 미칩니다. 몇 가지만 언급하자면, TripIt, TrueKnowledge, Wolfram|Alpha 혹은 Twine이 있습니다.

이런 이유로, 또 다른 성공 평가는 시멘틱 웹 기술들을 효과적으로 사용하게 하는 웹 애플리케이션의 성장과 시멘틱 웹 퍼즐의 새로운 조각들을 발명한 새로운 계획의 수에 대해 말합니다.

요약해서 말하면, 응답자들이 시멘틱 웹을 2020년까지 달성할 수 있다고 생각하는지에 대해 살펴보자. 모든 참가자의 41% (전문가의 38%)가 2020년까지 TBL이 예측한 시멘틱 웹은 “상당한 정도까지 이루어질 것이다”라고 동의했습니다. 한편 응답자의 47%(전문가의 52%)가 2020년까지 “이용자들은 큰 차이를 알아채지 못할 것이다”라고 생각하면서, 이에 대해 반대의견을 주장합니다.

-------------------------------------------------------

번역 상의 오류는 jino.kor@gmail.com으로 연락주시기 바랍니다. 항상 열려있습니다. 수정할 사항은 언제든 망설이지 말고 의견을 주십시오. 후반부 번역에 도움을 주신 고남희씨에게 감사드립니다.

2lis/10Off

Web 3.0: why, how, criticism, schism, and the future

노스캐롤라이나 주 Raleigh에서 열렸던 WWW 2010 컨퍼런스 동안에 실무 종사자들과 연구자들은 웹의 최근 발전과 미래에 대해 토론하기 위해 모였습니다. WWW 컨퍼런스는 웹(사이언스) 관련 가장 크고 중요한 컨퍼런스 입니다. Web이 Web 3.0을 향해서 진전하면서, 갈수록 더 많은 주제들이 시멘틱 웹에 연관되어 있습니다.

Kate Ray는 그렇게 많은 이 분야의 전문가들이 한 장소에 모여 Web 3.0에 대한 아주 인상적인 비디오 문서를 기록할 기회를 가질 수 있었습니다. 여기에 그것으로부터 배울 수 있는 것들의 개략 정보가 있습니다.

11maj/10Off

Prezentacja: Sieć  Semantyczna w teorii i w praktyce [InfoShare 2010]

Mam zaszyt zaprosić Was na moją prezentację pt. "Sieć Semantyczna w teorii i praktyce" w czasie odbywającej się w tym tygodniu (13-14 maja 2010) na Politechnice Gdańskiej darmowej konferencji InfoShare 2010. Prezentacja odbędzie się w piątek, 14 maja, o godzinie 15:00 .

9kwi/10Off

새로나온 책: Linked Data Patterns

지난 해 우리는 linked data의 개념과 웹 3.0발전에 있어서 linked data의 중요성에 대한 글을 작성한 적이 있습니다. Linked data의 역할을 감안할 때, linked data를 출판하고 사용하는 모든 사람들이 존중하고 따르는 범용적인 표준과 디자인 패턴은 매우 중요한 문제입니다.

Zakres tematyczny: Czytaj dalej
8kwi/10Off

SPARQL – cz. 4: Zaawansowanie filtrowanie

Po krótkiej przerwie wracamy do cyklu opisującego możliwości SPARQL. Dziś napiszemy o tym jak precyzyjniej definiować schematy poszukiwanych podgrafów wykorzystując do tego celu filtry.

23lut/10Off

Sezamie otwórz się – czyli instalacja Sesame 2.0

Zgodnie z wcześniejszą zapowiedzią (po małej przerwie) w dzisiejszym artykule opiszę jak w kilku krokach zainstalować bazę danych (repozytorium) RDF. Chociaż ten artykuł kierowany jest głównie do programistów, to jednak proces instalacji bazy Sesame jest na tyle prosty, że zachęcam każdego do zrobienia tego. W ten sposób łatwiej będzie wam sprawdzać poznaną wiedzę (szczególnie tę dotyczącą zapytań w języku SPARQL) w praktyce.

16lut/10Off

SPARQL – cz. 3: SELECT to nie wszystko

Każdemu kto zna SQL fakt, że zapytania SELECT w SPARQL zwracają tablicę wyników wydaje się to oczywiste. Dla tych, którzy znają XQuery - to takie oczywisto już nie jest. SELECT to jednak nie jedyny rodzaj zapytania w SPARQL, i co więcej SPARQL nie zawsze musi odpowiadać tablicą wyników.

12lut/10Off

Dlaczego Taksonomia to nie Ontologia ?

Odpowiedź na to pytanie przez wiele lat wydawało mi się całkiem oczywista. Kiedy w 2007 roku, w czasie naszego tutoriala o Semantycznych Bibliotekach Cyfrowych w czasie konferencji WWW (w nawiązaniu do slajdu 24), ktoś poprosił nas o dokładne wyjaśnienie różnic, okazało się, że zdefiniowanie odpowiedzi w sposób jednoznaczny nie było takie proste; po kilku latach pracy w tematyce Sieci Semantycznej i bibliotek cyfrowych - niektóre pojęcia przyjmuje się jak aksjomaty.

Ponieważ temat wypłynął niedawno na forum Biblioteka 2.0, postanowiłem zmierzyć się z tym pytaniem.