메타데이터의 개념 및 특징 (HTML/XML 비교)
기업 전략 분석 도구 – BCG 매트릭스 (캐시카우란?)
이번에는 차세대 웹 기술로 주목받고 있는 시맨틱웹과 이와 관련된 온톨로지의 개념 및 관계를 알아보고자 한다.
현재 흔히 접하고 있는 웹 2.0이 이용자가 참여하고 공유하는 양방향 소통의 특성을 가지고 있었다면, 웹 3.0은 이용자가 필요한 정보를 인공지능 웹이 알아서 선정하여 제시해 주는 것이다.
여기서 온톨로지는 차세대 웹 기술로 불리는 웹 3.0(시맨틱 웹)의 토대가 되는 핵심 개념이다. 온톨로지는 단어와 이와 관련한 관계들이 계층적으로 구성되어 있는데, 이를 확장하기 위한 추론 규칙도 함께 갖고 있어 웹과 응용 프로그램의 지식 공유가 가능하다는 특징이 있다.
여기서 말하는 웹 3.0을 시맨틱 웹이라 하며, 이러한 기술을 구현하기 위해서는 기계가 사람이 이해하는 수준으로 언어를 이해하는 것이 선행되어야 한다.
시맨틱 웹은 인간의 언어를 컴퓨터로 표현하고 이를 컴퓨터가 사용할 수 있게 만들어 컴퓨터가 정보를 추론하여 사용자에게 제공하는 환경을 말하며, 온톨로지는 인간이 합의를 통해 공통적으로 만든 개념을 컴퓨터에서 다룰 수 있도록 표현한 것이다.
컴퓨터는 여기서 온톨로지로 표현한 개념을 이용하여 지식을 습득하고 정보처리를 할 수 있게 되는 것이다. 즉, 시맨틱웹을 구현하기 위한 뼈대가 온톨로지라 할 수 있다.
(시맨틱 웹 : 인간의 언어 → 온톨로지 → 컴퓨터 이해 → 적합한 정보제공)
온톨로지 구성요소
온톨로지의 구성요소는 크게 클래스, 인스턴스, 속성, 관계로 나타낼 수 있다. 위의 이미지는 이 4요소를 조금 더 쉽게 이해할 수 있도록 컴퓨터라는 사물을 예로 들어 나타내 본 것이다.
- 클래스 – 일상에서 사물이나 개념을 부르는 명칭 / ex) 컴퓨터, 마우스, 모니터
- 인스턴스 – 클래스를 보다 구체적으로 표현한 개념으로 목적에 따라 달라질 수 있음 / ex) XX 게임용 컴퓨터, YY 무선 마우스, ZZ 커브드 모니터
- 속성 – 클래스와 인스턴스의 성질을 표현하기 위해 특정 값과 연결한 것 / ex) XX 게임용 컴퓨터의 그래픽카드는 [Geforce GTX1080TI]를 장착
- 관계 – 클래스와 인스턴스의 관계
그리고 온톨로지에 사용되는 용어로는 대표적으로 RDF, OWL, SWRL이 있는데, 각 특징은 다음과 같다.
- RDF – 일반적으로 개념 또는 인스턴스의 관계 표현
- OWL – 관계 인스턴스 내 정밀한 논리적 제약조건 표현
- SWRL – 관계 추론을 위한 규칙 정의
온톨로지 활용분야
온톨로지는 현재 인공지능과 번역을 위한 용도로 사용하기 위해 많은 관심과 노력이 기울여지고 있는 상황이다. 또한, 합의된 개념인 온톨로지를 활용해 유비쿼터스, 사물인터넷처럼 서로 상이한 기기들을 연결하거나 복합적 개념이 적용된 전자상거래 분야 등에도 활용될 수 있다.
- 인공지능 – 지식 표현과 활용 연구
- 정보검색 – 주제명표목표와 시소러스 등으로 불필요한 오류를 방지하고 검색 효율 증대
- 유비쿼터스 – 다수의 기기들이 인터넷망을 통해 동적으로 네트워크 형성
- 전자상거래 – 컴퓨터 프로그램이 상거래의 대부분을 맡아서 처리
위의 내용 중 정보검색 분야에서 언급한 시소러스는 문헌정보학에서 자주 언급되는 개념으로 아래 자료를 참고하기 바란다.
온톨로지는 하나의 단어가 지니고 있는 다양한 뜻의 관계를 파악해 빠르고 효율적인 검색을 수행할 수 있도록 해주며, 이러한 관계로 문맥을 파악하여 이용자에게 보다 나은 정보를 제공할 수 있는 기반이 된다.
또한, 이러한 기술을 활용한 시맨틱 웹(웹 3.0)은 한 단계 더 나아가 이용자가 원하는 정보를 컴퓨터(인공지능)가 모든 정보들이 관계로 연결된 환경 속에서 스스로 찾고 제공해 주기 때문에 차세대 웹 환경으로 주목받고 있다.
다만 아직 수많은 분야에 대한 개념 합의가 이루어지지 못해 온톨로지 개발 단계에서 주춤하고 있는 상황이다. 빠른 시일 내에 이러한 문제가 해결되어 급속한 발전을 거두고 있는 웹 환경에 더욱 탄력을 주는 날이 오기를 바란다.