시맨틱 웹(Semantic Web)과 RSS(Really Simple Syndication)

카테고리 : internet  |  작성일자 : 2008. 1. 31. 22:30  |  작성자 : 점프컷
이글은 RSS 이용규칙 과연 정당한 규칙인가?에서 뉴스보이님이 댓글로 의견을 주신 내용에 대한 답변의 성격입니다. 그러니 먼저 앞글을 참고하시고 이글을 읽어주시기 바랍니다.^^

1. 시맨틱 웹(Semantic Web)에 대한 간단한 소개

위키피디아에 나와있는 설명을 바탕으로 간단하게 시멘틱 웹에 대해서 소개를 드리겠습니다.

시맨틱 웹(Semantic Web)은 현재의 인터넷과 같은 분산환경에서 리소스(웹 문서, 각종 화일, 서비스 등)에 대한 정보와 자원 사이의 관계-의미 정보(Semantics)를 기계(컴퓨터)가 처리할 수 있는 온톨로지형태로 표현하고, 이를 자동화된 기계(컴퓨터)가 처리하도록 하는 프레임워크이자 기술이다. 웹의 창시자인 팀 버너스 리가 1998년 제안했고 현재 W3C에 의해 표준화 작업이 진행중이다.

내용은 길지 않으나 조금 난해하죠. 온톨로지부터 대부분의 사람들은 그만 읽어버립니다.^^;

팀 버너스 리 아저씨가 www 을 만들면서 인테넷의 창시자라고 불리워지고 있습니다. 바로 이 분이 주장한 내용인데요. 현재의 html을 기반으로 하는 웹은 사람이 읽기에는 좋지만 기계가 읽기에는 무리가 있습니다. 그래서 기계도 이해할 수 있는 웹 환경이 필요하다는 말입니다.

그럼 기계가 이해할 수 있는 언어는 뭐지? 아래와 같은 설명이 나옵니다.

시맨틱 웹은 XML에 기반한 시맨틱 마크업 언어를 기반으로 한다.

근데 왜 기계가 이해할 수 있는 언어로 웹을 만들어야 할까요?

그건 정보를 체계적이고 효율적으로 다루자는 취지입니다. 인터넷에서는 매일 수많은 사람들이 수많은 정보를 올리기에 양적으로 너무 방대합니다. 그래서 사람이 그런 정보들을 다 찾아볼 수가 없기에 정보에 대한 자동화된 접근성을 높여야 인터넷의 방대한 정보를 효율적으로 사용할 수 있다는거죠.

2. 시맨틱 웹(Semantic Web)과 RSS(Really Simple Syndication)

위키피디아의 설명에 아래와 같은 표현이 있습니다.

대중적으로 가장 널리 알려진 시맨틱 웹의 활용 예는 RSS이다.

사실 시맨틱 웹에 대해서 깊게 들어가면 저도 뭔 소린지 잘 모릅니다. 그러나 기본적으로 이런 의미에서 팀 버너스 리 아저씨가 미래의 웹은 시맨틱해야 한다고 주장했고 이 주장이 대중적으로 구현된 가장 대표적인 예가 RSS 라는 겁니다.

여기에 대해서는 윤석찬님의 시맨틱 웹, 2.0으로 거듭나라! 라는 컬럼을 참조해보기시 바랍니다.(IT쪽으로 관심이 없으신 분들에게는 조금 딱딱할 수도 있습니다)

그럼 RSS 피드는 무엇인가? 하면 컨텐츠의 메타 정보를 XML 언어로 구현해 놓은 페이지입니다.

아래는 제 블로그 RSS 피드 페이지의 일부입니다.

        <item>
            <title>RSS 이용규칙 과연 정당한 규칙인가?</title>
            <link>http://jumpcut.tistory.com/24</link>
            <description>...</description>
            <category>RSS</category>
            <category>RSS이용규칙</category>
            <category>온신협</category>
            <category>저작권</category>
            <author>점프컷</author>
            <guid>http://jumpcut.tistory.com/24</guid>
            <comments>http://jumpcut.tistory.com/24#entry24comment</comments>
            <pubDate>Tue, 29 Jan 2008 06:28:53 +0900</pubDate>
        </item>

RSS 피드를 제공할려면 XML 문법에 맞게 이런 페이지를 만들어 놓으면 됩니다.

이 페이지를 제공하는 의미가 정보에 대한 자동화된 접근성의 확보를 말합니다. 사람이 XML로 만들어진 RSS 피드페이지를 보라고 제공하는 것이 아니구요.

그러므로 기존의 HTML로 만들어진 페이지와 시맨틱웹의 정신으로 만들어진 RSS 피드 페이지는 다른 관점으로 접근해야 합니다.

만일 신문사의 홈페이지에서 오늘의 주요뉴스 이런식으로 RSS 피드와 동일한 내용을 HTML로 만들어서 기사 리스트를 제공한다면 이건 긁어가면 안됩니다. 사람이 보라고 만든 페이지지 자동화된 기술로 긁어가라고 만든 페이지는 아니거든요.

PHP 언어를 기본적으로 다룰 수 있다면 Snoopy와 같은 공개된 클래스를 이용해서 HTML 페이지를 긁어갈 수 있습니다. 실제로 이런식으로 남의 홈페이지를 긁어서 자기의 홈페이지에 반영하는 경우도 많구요.(프레임을 활용하는 경우도 많죠)

이런식의 서비스라면 당연히 그건 불법이고 저작권이 침해된다고 할 수 있습니다. 그리고 남의 홈페이지를 RSS 피드를 자동으로 만들어버리는 서비스도 있죠. 이런 서비스 역시 저작권을 침해한다고 생각합니다. 저작권자가 RSS 피드를 제공할 의향도 없는데 만들어 버리니 말이죠.

그러나 XML로 만들어진 RSS 피드 페이지는 기존 웹페이지와 그 성격이 다릅니다.

뉴스보이님이 아래와 같이 지적하셨는데요

시맨틱웹의 관점이 무단 재배포를 허용하고 있는 개념인가요? 하지만 콘텐츠 제작자는 그 부분에 동의한 적이 없는데요? 시멘틱웹은 지능형 웹 그 이상도 그 이하도 아닙니다. 동의를 하지 않았는데 어떻게 동의를 했다고 간주를 하시는지 이해가 안됩니다.

이건 무단 재배포라고 표현하기 보다는 자동화된 접근성이라고 표현하는게 적당하고, 콘텐츠 제작자가 RSS 피드를 제공한다는 것 자체가 자동화된 접근에 동의한다는거죠.

단순히 컨텐츠를 소개한다면 왜 굳이 기계가 이해할 수 있는 XML 문법에 맞추어서 이런식으로 통일된 형식으로 페이지를 만들겠습니까? 사람이 아닌 기계가 자동으로 읽어가라고 만든 페이지 입니다.

그 기계가 RSS 리더이든 위자드웍스 사이트와 같은 홈페이지이든 그게 중요한게 아니구요. 어떤 형식으로든 피드로 제공된 메타정보를 변형시키거나 의도적으로 누락시키지 않고 정상적으로 접근하면 그건 허용이 된다는 의미로 봐야한다는 거죠.

3. RSS 피드의 자유로운 이용과 카피레프트 정신은 엄연히 틀립니다.

전 개인적으로 카피라이트 주의입니다. 저작권은 당연히 보호되어야 하고 인터넷이란 공간에서도 저작권은 지켜져야지 더욱 유용한 컨텐츠들이 인터넷을 통해서 이용될 수 있기 때문이죠.

제가 작성한 포스트들을 보시면 광고수익모델에 대한 글들이 좀 있습니다. 애드센스라는 광고수익이 현실적으로 개인이 작성한 컨텐츠에 대해서 보상을 해줄 수 있는 아주 중요한 기능을 가지고 있기 때문에 이 부분에 관심이 많습니다.

애드센스를 통하여 개인의 컨텐츠에게도 보상이 돌아가게 된다는 것을 좀더 많은 사람들이 느낀다면 네티즌들이 저작물에 대한 권리에 관심을 가지게 될 것이고, 이로인해 우리 인터넷의 불펌 문화가 어느정도 근절될 것이라는 희망도 가지고 있습니다.

근데 인터넷의 저작권을 가장 공공연하게 침해한다고 볼 수 있는 불펌을 막을 수 있는 방법 중에 가장 효율적인 것이 링크 문화의 확산입니다. 불펌대신에 링크 하라는 거죠.

그리고 RSS라는 것은 자동화된 링크라고 볼 수 있습니다. RSS는 컨텐츠의 링크를 자동으로 만들고 자동으로 퍼트리는 기능을 하기에 링크 문화의 발전에 큰 기여를 하게 됩니다. 그래서 RSS의 사용이 더욱 권장되어야 하고, 시맨틱웹과 저작권 보호는 상충되는 부분이 없이 인터넷 문화를 발전시켜 나갈 수 있다는 생각입니다.

정리하자면, RSS 피드를 제공한다는 의미는 정보에 대한 자동화된 접근을 허용한다는 의미이고, RSS 피드를 제공할지 여부는(자동화된 접근을 허용할지 여부는) 전적으로 저작권자에게 있으며 그러기에 RSS 피드 페이지 자체는 저작권에 기반을 한 이용규칙 같은 것이 필요없다는 말입니다.

RSS의 이용규칙을 굳이 만들자면 컨텐츠의 메타정보를 왜곡하거나 누락시키지 않는다는 정도의 규제인데 이건 거의 상식적으로 지켜지기에(안지키는 경우 네티즌들의 비난을 면치 못하죠. 예전에 다음의 RSS넷 사건에서 볼 수 있듯이) 어떤식으로 생각해 보아도 RSS 이용규칙은 불필요하다는 겁니다.

RSS와 XML 그리고 시맨틱 웹이라는 개념이 따로 구분해서 생각할 수 없다는데 동의하시면 제 주장이 무리없이 받아들여질 것 같습니다.
Posted by 점프컷
: