speclogo

IMS 어휘교환(VDEX) - 정보 모델

발행일 2009년 00월 00일
최신 버전 IMS 어휘교환 표준 - 정보 모델 버전 1.0
이전 버전

1)IMS 지적재산권 웹 페이지 : http://www.imsglobal.org/ipr/imsipr_policyFinal.pdf
원안작성 협력기관 : 한국교육학술정보원(IMS Korea 표준화 포럼)
성 명 근 무 처 직 위
(위 원 장) 황대준
성균관대학교
교수
(실무위원) 김성윤
(주)포씨소프트
이사
김 현
(주)씨티유니온
차장
유욱종
(주)다울소프트
부장
조성현
테크빌닷컴(주)
부사장
조용상
한국교육학술정보원
팀장
차남주
(주)디유넷
부사장
최성기
SK C&C
과장
(자문위원) 권희춘
수원여대
교수
김종현
계원디자인예술대학
교수
김현진
한국교원대학교
교수
손진곤
한국방송통신대학교
교수
정광식
한국방송통신대학교
교수
한태인
(주)메디오피아
부사장
(간 사) 신성욱
한국교육학술정보원
연구원

머 리 말

이 표준은 한국의 이러닝 분야 디지털 콘텐츠의 공유 및 유통 체제 확립을 위해 IMS Global Learning Consortium(이하 GLC)의 Vocabulary Definition Exchange 표준을 기초로 작성한 IMS Korea 단체표준이다. 이 표준은 한국의 문화적, 교육적, 언어적 특수성 등을 감안하여 현지화 등 확장을 고려하여 작성되었다. 또한 이 표준을 실제 구현할 때 부분적으로 선택하여 적용할 수 있도록 필수와 선택 영역이 구분되어 있으므로 목적에 따라 선별적인 적용이 가능하다. 이 표준은 다양한 분야나 시스템상에서 사용되는 여러 종류의 어휘들에 대한 표현법을 정의하고 있으며 어휘교환 표준을 사용해 표현이 가능한 다양한 어휘 유형이 소개된다. 그러나 IMS 어휘교환 표준은 일반적으로 사용되고 있는 모든 어휘 유형을 표현하는 데에 사용될 수 있는 것은 아니며, 시스템상에서 해석이 가능한 비교적 심플한 용어들을 어휘단위로 구성할 때 쓰여질 수 있는 표현방식을 기술하는 데에 초점을 두었다. 따라서 이 표준은 시스템상에서 처리가 가능하도록 다양한 인간 언어 용어를 특정 목록으로 표현하는데 사용될 수 있다. 이 목록은 각 용어의 고유 의미와 활용 정보가 기술되어 있으며 이와 같은 용어들은 종종 시소러스(thesauri)의 형태로 수집된다. 이 표준은 다양한 임의적 관계 유형을 사용해 시소러스를 표현하는 것을 가능하게 한다. 이 표준은 멀티파트로 구성되며, 다음과 같은 세가지 표준 문서로 구성된다.
  • Part 1 : 정보 모델 (Information Model)
  • Part 2 : XML 바인딩 (XML Binding)
  • Part 3 : 활용 사례 및 실행 가이드 (Best Practice & Implementation Guide)
이 표준은 저작권법에서 보호 대상이 되는 저작물이다. 이 표준 문서의 표지에 있는 지적재산권 공지 사항을 숙지할 것을 다시 한번 강조한다.

1 서론

1.1 개요 및 다른 표준과의 관계

IMS 어휘교환 표준은 다양한 분야나 시스템상에서 사용되는 여러 종류의 어휘들에 대한 표현법을 정의한다. 1.3.2장에서는 어휘교환 표준을 사용해 표현이 가능한 다양한 어휘 유형이 소개된다. ISO는 ‘어휘(vocabulary)’ 대신 ‘값 영역(value domain)’이라는 명칭 그리고 어휘를 구성하는 용어는 ‘허용 값(permitted value)’이라는 명칭을 사용하기를 선호한다. 값 영역은 허용 값들의 집합이다. IMS 어휘교환 표준은 일반적으로 사용되고 있는 모든 어휘 유형을 표현하려는 데에 사용될 수 있는 것은 아니다. 시스템상에서 해석이 가능한 비교적 심플한 용어들을 어휘단위로 구성할 때 쓰여질 수 있는 표현방식을 기술하는 데에 초점을 둔다. 나아가 어휘교환 표준은 기본적으로 어휘의 설계를 목적으로 하는 소위 모델링 언어가 아니며, 어휘 생성자나 관련분야의 전문가가 관심을 가질 수 있는 몇 가지 특성에 대해 소개하고 있지만 최종 사용자가 반드시 이와 같은 특성을 이해 또는 사용할 필요는 없다. IMS 어휘교환 표준은 시스템상에서 처리가 가능하도록 다양한 인간 언어 용어를 특정 목록으로 표현 하는데 사용될 수 있다. 이 목록은 각 용어의 고유 의미와 활용 정보가 기술되어 있다. 이와 같은 용어들은 종종 시소러스(thesauri)의 형태로 수집된다. 어휘교환 표준은 다양한 임의적 관계 유형을 사용해 시소러스를 표현하는 것을 가능하게 한다. 그리고 ISO 2788과 ISO 5964 표준에서 정의하는 임의적 관계 유형 또한 이와 같은 용도로 사용될 수 있다. 또한 IMS 어휘교환 표준은 IEEE LOM, IMS 메타데이터, IMS 학습자 정보 패키지, ADL SCORM 등과 같은 인스턴스에서 사용되는 데이터를 표현하는데도 활용될 수 있다. 이와 같은 표준에선 값 목록(value list)을 사용하는 요소들이 종종 ‘어휘 데이터 유형(vocabulary data type)’으로 설명되거나 또는 개별 영역 및 값 식별자를 통해 표현된다. 허용 값이란 형식상으로 어떠한 개념을 구별하기 위한 코드이며 사람이 일반적으로 사용하는 용어와 문자상 동일하지 않을 수 있다. 반면에 어휘 데이터 유형은 전형적으로 구조화되지 않은 불규칙적인 용어들에 대한 목록을 갖고 있으며, 메타데이터 체계는 계층적 어휘분류법을 사용하여 대상을 분류하는 표현 및 방식을 허용한다. 계층적 어휘의 예로는 듀 데시멀 분류법(DDC)과 미국 의학도서관 용어집인 MeSH 와 같은 전문적인 체계를 들 수 있다. 어휘교환 표준은 간결한 방식으로 계층적 체계를 상세하게 표현할 수 있으며, 필요한 경우 그 내용이 불충분한 네트워크내의 관계에 대한 표현도 허용한다. 다중 계층관계 체계와 국제 10진 분류법 같은 나열형 체계는 IMS 어휘교환 표준으로 표현하는 것이 불가능하다. 또한 어휘교환 표준은 정보 모델을 통해 다양한 용례들을 소개하며, 이 표준의 활용 사례 및 실행가이드 문서는 몇 가지 권장사항을 제시한다. 관련 분야 전문가들은 다음과 같은 테크닉을 적용할 필요가 있을 수 있다.
  • 관계 유형 맞춤 세트 정의 및 어휘교환 모델 활용
  • 특정 작업에 어휘교환 표준 활용
  • 어휘교환 모델 확장
  • 보다 정교한 모델에 어휘교환 표준 반영

1.2 IMS 어휘교환 표준의 구성요소

어휘교환 표준은 시스템상에서 해석 및 처리가 가능한 비교적 단순한 용어들의 표현 및 용어들이 선택적으로 교환되는 것을 허용한다. 어휘교환 표준에서 다루는 다양한 특정 용어 유형은 1.3.2장에서 정의된다. IMS 어휘교환 표준 버전 1.0은 각각 고유한 적용범위를 가지는 다음의 부분들로 구성되어 있다. 정보 모델 표준의 핵심 부분을 설명하며 이 정보모델을 기반으로 하는 모든 바인딩의 기준이 되는 부분을 기술한다. 의미론, 구조, 데이터 유형, 값 스페이스, 다중도, 필수여부(필수 또는 선택)와 같은 특성들에 대한 상세정보 또한 포함하고 있다. XML 바인딩 XML 버전 1.0을 기준으로 정보모델의 바인딩을 설명하고 있으며 표준에 대한 참조에 의해서든 또는 표준이 지정한 네임스페이스 선언에 의해서든 이 바인딩을 사용하고자 하는 모든 XML 인스턴스의 토대가 된다. 바인딩의 오차 또는 누락이 발생하는 경우에는 정보모델이 우선적으로 토대가 되어 참조되어야 한다. XML 바인딩 문서는 어휘교환 바인딩을 적용할 때 사용되어야 하는 W3C XML 스키마 1.0 기반의 관리 문서(control document)와 함께 제공된다. 활용 사례 및 실행 가이드 정보모델 및 XML 바인딩의 활용에 관한 비표준적인 지침을 제공한다. 이 문서는 어휘교환 표준의 상호운용성 및 내구성 증진을 목적으로 하는 다양한 표준 활용 사례에 대한 지침을 포함해서 어휘교환 표준이 지지하는 방향으로 표준을 활용하고 있는 현재 진행중인 사례들을 소개한다. 또한, 개념적 프레임워크가 어떻게 실제로 사용될 수 있게 매핑되는지를 나타내는 예시 및 이 표준과 관련된 IMS 표준들과 어휘교환 표준간의 관계를 식별하기 위한 예시가 제공된다. 반드시 따라야 하는 것은 아니지만 활용 사례 및 실행가이드 문서에 포함된 지침을 따르는 것이 바람직하다.

1.3 적합성 요구사항

다음은 이 표준의 인용 또는 참조표준으로 발행연도가 표기되지 않은 표준은 최신판을 적용한다. 이 표준은 ‘어휘’ 및 관련 용어에 대해 광범위하게 수용되고 있는 정의를 채택한다. 저명한 기관들의 정의를 토대로 어휘 정의들을 정리하여 제공하고 있으며 다양한 유형에 대한 정의는 다음과 같다. 어휘(Vocabulary): ‘특정주제분야에관련된용어의사전.’ 1 ‘1. 간단한설명이포함된단어리스트; 현재는특히기초문법또는외국어읽기책에서볼수있는단어리스트. 2. 특정인물, 계층, 전문인력등이사용하는언어의범위. 3. 언어를구성하는단어들의합또는집합.’2   분류(Classification): ‘개념들을구별하여종류별로모아놓은것그리고그들간의의미론적관계를설명하기위한세분; 종류들은기호로표시된다 ‘. 3 ‘1. 공통의특징또는성질에따라종류별로구분또는나열하는행위; 적절한클래스에배정. 2. 분류의결과; 종류또는종류들내에서체계적인분할, 할당, 또는나열; 특히, 과학또는체계적인조사의대상을주제별로분류.’4   분류학(Taxonomy): ‘1. 특히일반적인법또는원칙들과관련된분류; 과학의분야또는특정과학또는주제의분야로분류안에구성되어있거나그와관련된것; 특히살아있는사물들의체계적인분류이다. 2. 모든것의분류.’ 5 시소러스(Thesaurus): ‘사용범위가제한적이며형식에맞춰만들어진색인목록으로, 개념들(예를들어광의로그리고협의로) 간의선험적관계가구체화되어있다.’ 6 ‘2.b. 지각(sense)에의해열거된개념또는단어들의집합; 또는 (미국) 동의어또는반의어사전. 2.c. 용어를분류한목록, 특히인덱싱및정보수집등의특정분야핵심어들.’ 7 용어집(Glossary): ‘주어진언어로된오래되거나, 희귀하거나, 잘알려지지않았거나, 또는새로만들어진단어들의사전.’ 8 ‘언어들의모음; 난해하거나, 오래되거나, 방언이거나또는기술언어의설명들을같이실은목록; 사전의일부.’ 9 사전(Dictionary): 어떤 한 언어로부터 나온 단어들의 집합 또는 카테고리로서, 하나 또는 그 이상의 언어로 설명 및 해석하여 철자 순 또는 체계적으로 나열한 것.10 ‘1.a. 한언어의개별단어(또는이들의특정분류)들을다루는책, 이들의철자, 발음, 중요도, 용법, 동의어, 파생어, 역사, 또는적어도이들사실중일부를설명하기위한것: 참조를용이하게하기위해이들단어는몇가지정해진순서로나열되며, 현재는대부분의언어가철자순서를따르고있다; 그리고보다큰사전에서문학작품에서인용하여설명하기도한다; 단어책또는어휘집. 1.b. 누구든지사용하고누구에게나허용되는단어들의어휘또는전체목록. 2.a. 확장의미: 어떠한주제나많은철자로된지식에대한정보또는이를참조하는책으로, 철자순으로나열되며; 철자순으로정리된백과사전과같다.’11

2 용어정의

2.1 약자와 약어

  • ADL : 고급 분산학습(Advanced Distributed Learning)
  • DDC : 듀이 데시멀 분류 스키마(Dewey Decimal Classification Scheme)
  • IEEE : 전기 및 전자 엔지니어 협회(Institute of Electronic & Electrical Engineering)
  • IETF : 인터넷 엔지니어링 테스크 포스(Internet Engineering Task Force)
  • ISO : 국제표준기구(International Standards Organization)
  • LOM : 학습 객체 메타데이터(Learning Object Metadata, ‘IEEE LOM’)
  • LTSC : 학습 기술 표준 위원회(Learning Technology Standards Committee)
  • SCORM : 공유가능 콘텐츠 객체 참조모델(Shareable Content Object Reference Model)
  • UDC : 범용 데시멀 분류 스키마(Universal Decimal Classification Scheme)
  • VDEX : IMS 어휘교환 표준(IMS Vocabulary Definition Exchange Specification)
  • W3C : 월드와이드웹 컨소시엄(World Wide Web Consortium)
  • XML : 확장 마크업 언어(Extensible Mark-up Language)

3 정보 모델

이 장은 표준화되었다. RFC 2119에 정의된 용어들은 RFC 2119 가 정의하는 의미에 따라 사용된다. 정보 모델의 전체적인 구조는 다음의 그림과 같으며, 3장에서 구체적인 설명이 제공된다. 용어 구조는 반복 또는 중복될 수 있다. 단, 정보모델 그림과 정보 모델 요소설명 내 모든 단계에 나오는 요소들의 순서는, 순서를 중시한다는 구체적인 명시가 없는 한 그리 중요하지 않다는 점에 유의한다. 주: 일부 바인딩에선 요소들에 대한 특정한 순서가 요구될 수도 있다.

IMS KR 1007-1_clip_image002

그림 3.1 정보모델도식

3.1 어휘에 대한 설명

이 장은 값 영역에서 사용되는 용어들의 특성에 대해서 다룬다.
  1. 식별자(Identifier): 등록 기관(registration authority)의 감독하에 있는 전역 고유 식별자 또는 생성자가 그 지속성을12 보장하고 혼란을 피하기 위해 사용되는 미등록 상태의 고유 식별자. 어휘 식별자는 그 표현형식이 일종의 문자열 형태이지만, 교환을 위해서는 RFC 2732의 개정본인 RFC 2396에서 허용하는 문자 및 인코딩만을 사용해야 한다. 이는 구문상으로 볼 때 완벽한 URI이다. URI의 일부만은 포함할 수 없다. 활용 사례 및 실행 가이드에서는 식별자 활용에 관한 몇 가지 사안들이 소개된다.
  1. 등록 상태(Registration Status): 해당 식별자가 등록되었는지의 여부를 선언하는 플래그(flag)이다. 메타데이터를 이용하여 등록한 기관과 같은 정보를 파악할 수 있다. 구체적으로 명시되지 않는 한 어휘들은 미등록으로 간주한다.
  1. 명칭(Name): 인간 언어로 표현될 수 있는 명칭이다. 한 어휘에 지정될 수 있는 명칭의 수에 대한 제한은 없다. 어휘 명칭을 식별자 대신 사용하는 것은 허용하지 않는다.
  1. 프로파일 유형(Profile Type): 이 특성은 인스턴스가 나타내는 어휘 클래스를 구체화하기 위해 사용될 수 있다. 프로파일 유형의 사용에 대한 자세히 설명은 4.2장에서 다루고 있다. 구체적으로 명시된 프로파일 유형이 없다면, ‘lax’로 간주한다.
  1. 순서 중요성(Order Significance): 이 특성은 용어들의 나열순서의 중요 여부를 나타내는데 사용된다. 용어의 계층이 존재하는 경우, 이 중요성은 상위 레벨 용어에만 적용된다. 기본 정보는 “순서가 중요하지 않다(not significant)” 이다.
  1. 디폴트 언어(Default Language): 선택적 특성으로서 언어 문자열 형태의 모든 요소의 기본 언어를 선언하는데 사용될 수 있다. 개별 언어 문자열 레벨에서 겹쳐 쓰기가 가능하다.
  1. 메타데이터(Metadata): 어휘에 대한 추가설명을 제공하는 선택적 메타데이터 레코드. 메타데이터와 이 메타데이터가 기술하는 데이터 간에 긴밀한 연결성이 필요한 경우 활용될 수 있는 특성이다. 하나 이상의 메타데이터 요소가 사용될 수 있지만 각 메타데이터 요소에는 하나의 메타데이터 기록 만이 포함될 수 있다.

3.2 용어(Term)에 대한 설명

어휘는 반드시 허용 값이 비어 있지 않은(non-empty) 상태로 구성되어야 한다. 특정 어휘에 종속되어 있는 각각의 용어와 그 관계는 다음의 특성을 지닌다.
  1. 식별자(Identifier): 어휘에포함되어있는용어들을식별하는고유한문자열. 이는다른용어로부터정의된관계들을위한대상물로사용될있다(아래, ‘관계참조).
  1. 유효인덱스(Valid Index): 용어에대한인덱싱어플리케이션의사용가능여부를나타내는표시이다.
  1. 캡션(Caption): 용어에대한캡션을의미한다.
  1. 설명(Description): 용어의원활한사용과용어에대한의미를위한주석으로이상의설명이용어에지정될있으며, 캡션과는별도로다른언어로입력될있다.
  1. 미디어설명자(Media Descriptor): 설명에기록되어있는내용을보다명확히뒷받침할있는미디어파일또는파일들로설명특성을대체할있다.
  1. 미디어로케이터(Media Locator): 미디어파일의위치를나타내는 URL이다.
  1. 실행주석(Implementation Note): 미디어가용어에어떻게연결되어있는가를설명하는주석으로주석은다양한언어로표현할있다.
  1. 순서 중요성(Order Significance): 이 특성은 선언된 용어의 하위(child) 용어에 적용된다. 순서 중요성에 대한 명령문이 설정되어 있지 않는 경우, 하위 용어들에 대한 지정 순서는 중요하지 않은 것으로 간주된다. 용어의 계층 구조에서 이 특성은 상속되지 않는다는 점에 유의한다.
  1. 용어(Term): 정보 모델에서 용어는 계층구조의 형태로 나열될 수 있다. 즉, 관계 요소를 사용하지 않고도 다양한 용어에 나열이 가능하다. 이와 같은 나열 체계가 사용될 수 있는 분류법은 유일하게 상위-하위(parent-child) 관계 유형만을 허용하는 분류법이다. 시소러스에서 기술하는 더 광범위하거나 더 협소한 용어 관계를 표현하기 위해 사용되어서는 안 된다.
  1. 메타데이터(Metadata): 일종의 컨테이너로 용어 레벨에서 사용가능하며, 어휘 전체에 대해서도 사용된다.

3.3 관계(Relationship)에 대한 설명

  1. 식별자(Identifier): 식별을 위한 선택적 문자열이며, 존재하는 경우 어휘 내의 용어들간에 고유해야 한다.
  2. 소스용어(Source Term): 관계의소스가되는용어의식별자로이특성으로식별되는용어는반드시존재하나다른어휘안에있을수있다. 추가정보는바인딩문서참조.
  3. 소스어휘(Source Vocabulary): 소스용어를포함하는어휘의식별자. 이정보가존재하지않는다면, {source|target} 어휘가 관계를 포함하는 어휘와 동일한 것이다.
  4. 타겟용어(Target Term): 관련용어의식별자로이특성으로식별되는용어는반드시존재해야하며다른어휘안에있을수있다. 추가정보는바인딩문서참조.
  5. 타겟어휘(Target Vocabulary): 관련용어를포함하는어휘의식별자이정보가없다면, {source|target} 어휘가 그 관계를 포함하는 어휘와 동일한 것이다.
  6. 관계유형(Relationship Type): 다양한관계유형은소스화된어휘를사용하여설명된다. 어휘교환 표준에서는 관계 유형을 표현하기 위한 어떠한 어휘든지 그 사용을 필수로 정하고 있지는 않지만, 만약 단일 또는 다국어 시소러스에서 표현되는 경우에는, 5장에서 그 사용을 권고하고 있다.
  7. 메타데이터(Metadata): 일종의 컨테이너로 용어 레벨에서 사용가능하며, 어휘 전체에 대해서도 사용된다.

4 어휘교환 요소

이 장은 표준화된 부분이다. RFC 2119에 정의된 용어들은 RFC 2119 가 정의하는 의미에 따라 사용된다. 어휘교환 표준 정보 모델에 표기되어 있는 다양한 명칭들은 어떠한 바인딩에서도 그 사용이 보장되는 표준화된 공식 명칭이라 할 수 없다. 바인딩에 명명된 요소는 정보 모델에 포함된 요소들 중에 바인딩 요소와 관련이 있는 요소가 어떠한 것인지 식별하는 목적으로만 활용될 수 있다. 4장은 어휘교환 표준에서 주로 다뤄지는 다양한 어휘 종류와 일반적 어휘구성 문법(아래 표)간에 존재하는 여러 제약에 대해 기술한다.

4.1 어휘를구성하는정보요소

명칭

사용설명

스페이스

데이터유형

SPM

다중도

1
1 Order Significance 용어들의 구성순서에 대한 중요 여부를 명시함. 기본값은 ‘false’.

Boolean

-

0..1

2 Profile Type 어휘 유형에 대한 설명. 제한적 유효성 지원을 위해 사용될 수 있음. 기본값은 ‘lax’. 3.2장 참조

enum

-

1

3 Vocabulary Name 인간 언어로 어휘를 명시. 다양한 언어로 명시될 수 있음. ISO/IEC 10646-1:2000 목록

Langstring

* 주석 참조

1000자

0..1

4 Vocabulary Identifier 어휘에 대한 식별자. 값 영역을 식별한다. 이 요소는 식별자가 알려지지 않은 경우를 선택적으로 지원한다. 지정된 식별자가 존재하는 경우, 이 식별자가 제공되어야만 한다. 주석 참조

URI

4096자 2

0..1

4.1 Registration Status 어휘와 그 식별자가 공식 기관으로부터 등록 되어 있는 가의 여부. 기본값은 ‘false’.

Boolean

-

0..1

5 Default Language 독립적으로 언어를 선언하는 경우를 제외하고 ‘langstring’ 유형으로 된 모든 요소의 기본 언어 언어 코드 (3.1장 참조)

String

3.1장 참조

0..1

6 {Term} 표 3.2 참조

Container

1..*

7 {Relationship} 표 3.3 참조

Container

0..*

8 Metadata 어휘에 대한 메타데이터. 임의적인 메타데이터의 컨테이너.

Container

10 reps

0..*

 
1 UML 기호법에서, 아래 표로 요약된다. 2 URN 식별자를 지원한다.

4.2 용어를구성하는정보요소

명칭

사용설명

스페이스

데이터유형

SPM

다중도

6 Term 어휘 문항

Container

1..*

6.1 Identifier 어휘 범위 내에 있는 값에 대한 식별자 주석 참조

URI

100자

1

6.2 Valid Index 인덱싱에서 사용할 수 있는 용어 인가의 여부를 표시하는 플래그. 기본값은 ‘true’

Boolean

0..1

6.3 Caption 인간 언어로 명시됨.

Langstring

* 주석 참조

1000자

0..1

6.4 Description 용어에 대한 의미 및 그 사용을 인간 언어로 설명한 것.

Langstring

* 주석 참조

2000자

0..1

6.5 Media Descriptor 이미지(정적 또는 동적), 오디오 등의 미디어 URL 위치정보. 명확한 의미를 전달하는 데 유용.

Container

0..*

6.5.1 Media Locator 미디어 파일의 위치. 주석 참조

URI

4096자

11

6.5.2 Implementation Notes

Langstring

주석 참조

2000자

0..1

6.6 Order Significance 하위 용어들의 순서가 중요한가의 여부. 기본값은 ‘false’

Boolean

-

0..1

6.7 Metadata 용어에 대한 메타데이터. 임의적인 메타데이터에 대한 컨테이너.

Container

0..*

6.8 {Term} 분류법을 표현하는 목적으로 사용되는 Term 요소

Container

0..*

 
1 선택적 요소의 필수 하위요소는 만약 그 선택적 요소가 사용될 경우 하위요소가 반드시 나타나야 한다는 의미로 해석되어야 한다.

4.3 관계를구성하는정보요소

명칭

사용설명

스페이스

데이터유형

SPM

다중도

7.1 Identifier 어휘 범위 내에 있는 값에 대한 식별자.

주 참조

URI

100자

0..1

7.2 {Source Term} 관계가 시작되는 용어. 표 3.4 참조.

Container

1

7.3 {Target Term} 관계가 타겟으로 하는 용어. 관계가 시작되는 용어는 타겟 용어와 연결되어 있다. 표 3.4 참조.

Container

1

7.4 Relationship Type 관계의 유형을 식별한다. 관계 유형의 어휘들은 어플리케이션이 요구하는 대로 소스화 될 수 있다.

Container

-

0..1

7.4.1 Source of type 관계 유형 어휘의 소스 식별자

주석 참조

URI

4096자

1

7.4.2 Value of type 관계 유형에 대한 용어

주석 참조

URI

100자

1

7.5 Metadata 관계에 대한 메타데이터. 임의적인 메타데이터의 컨테이너.

Container

0..*

4.4 용어참조(Term Reference)구성하는정보요소

명칭

사용설명

스페이스

데이터유형

SPM

다중도

1 Term Identifier 용어에 대한 식별자 주석 참조

URI

1000자

1

2 Vocabulary Identifier 용어를 포함하는 어휘의 식별자로 어휘 식별자가 없는 경우에는 관계에서 정의하는 어휘를 사용한다. 주석 참조

URI

1000자

0..1

 
유형들: Langstring – 이 표준에서 정의 URI – RFC2396 따름 String - ISO/IEC 10646-1:2000 따름 Boolean - ISO 11404 따름 Language Code - RFC 1766 따름 UML 다중도(multiplicity) 기호: 0..1 - 선택은 가능, 반복은 불가능 0..* - 선택이 가능, 반복도 가능 1..* - 적어도 한 번 이상은 필수이며 반복이 가능 1 - 한 번만 필수 주석 (최소허용최대값(SPM)): 이는 [m chrs] 포맷으로 표현된다. ‘m chrs’ 는 실행시 텍스트 형태의 요소 내에서 반드시 지원해야 하는 유니코드 문자의 최소 개수를 나타낸다. 요소가 ‘langstring’ 유형인 경우에는 각 langstring 내의 문자들의 개수를 SPM 요구사항으로 적용한다. 주석 (반복가능한요소): ‘Multiple’이 표시된 요소들은 반복될 수 있다.

4.1 Langstring 요소

‘langstring’ 유형과 ‘single’ 다중도를 갖는 요소들은 단 1회만 생성될 수 있으나, 다수의 langstring 값을 가질 수 있고, 그 각각은 그에 상응하는 내용을 내포하고 있다. 표 3.1과 표 3.2 의 SPM 칼럼에선 각각의 다양한 제약들을 명시하며, 이 제약들은 동반하는 SPM 기호법과 실행 주석의 참고를 통해 해석된다.

4.5 - Langstring구성하는정보요소

명칭

사용설명

스페이스

데이터유형

SPM

다중도

A 언어 문자열(Language String) 인간 언어 문자열 ISO/IEC 10646-1:2000 목록

String

사용 문맥에 의해 정의

-

A.1 언어(Language) 문자열을 구성하는 언어 언어 코드

String

-

0..1

만약 개별 langstring 요소가 언어 특성을 선언하지 않는다면, 인스턴스의 기본 언어(Default Language)는 langstring의 언어와 동일하게 지정된다. 디폴트 언어가 없다면, 문자열의 언어가 정의되지 않은 것이다. 사용자들은 반드시 다음 사항을 주의해야 한다.
  • 동일한 상위 요소 내에 있는 두 개 이상의 langstring 값들은 정의되지 않은 값을 포함해 동일한 언어 특성을 가질 수 없다.
  • 정의되지 않은 언어는 그 사용을 피해야만 한다.
  • 사용자들은 동일한 컨테이너 안에서 동일하지 않은 langstring 값들을 배치하는 것을 권장하지 않는다.
언어 특성의 값 스페이스와 인스턴스 디폴트 언어 특성은 ‘언어 코드’로 선언된다. 이는 반드시 RFC176613의 요건에 부합해야 한다13.

4.2 객체모델

이 장은 표준화된 부분이 아니다. 그림 4.1은 UML 기호법을 따르는 클래스 다이어그램으로서 이 문서를 이해하는데 도움이 될 수 있다. 이 문서가 정의하는 유형을 제외하고는 어휘 데이터 유형과 langstring에 관련된 다른 유형은 표기되지 않았다. 이 다이어그램은 정보모델을 정의하지는 않지만 표 3.1과 표 3.2에 기술되어 있는 내용을 보충한다.

IMS KR 1007-1_clip_image002

그림 4.1 어휘교환모델의 UML 표현

비록 관계내의 소스 또는 타겟 용어가 각각 다른 어휘에 포함되어 있어도, 관계는 항상 2진수(binary)로 나타내어진다.

5 ‘프로파일 유형’ 특성의 의미론 및 값 스페이스

5.1 서론 및 배경

이 장은 표준화된 부분이 아니다. ‘프로파일 유형’ 이라는 전문 용어는 ‘어휘 유형’ 이라는 말과 동일한 것으로 표현될 수 있으나 두 용어 모두 잘못 해석될 여지가 있다. 어플리케이션 프로파일을 말하고 있는 것이 아니다. 어휘교환 표준에서 소개하는 ‘프로파일 유형’은 사용이 빈번한 정보모델의 하위세트를 나타낸다. 하위세트는 보다 익숙한 다양한 종류의 용어집을 구성하는 요소에 대한 정보를 제공하는 것이 목적이다(2장 참조). ‘프로파일 유형’은 표현되고 있는 어휘 클래스를 식별하기 위한 어휘 특성이 아니며, 따라서 여기서는 ‘어휘 유형’ 이라는 용어는 사용하지 않는 것이 바람직하다. 프로파일 유형은 공식적으로 어휘교환 표준 인스턴스의 특성이며 현재 사용 중인 어휘교환 표준 문법의 하위세트를 구체화한다. 이 특성은 다음 사항을 실행하는데 사용된다.
  • 지나치게 무거워지지 않도록 어휘교환 문법의 최소 필수 하위세트를 실행단계에서 사용하는 것을 허용한다.
  • 데이터 교환자가 자발적으로 자유의 정도를 제한할 수 있는 기회를 제공함으로써 상호운용성을 증대한다.
  • 어휘교환 표준은 다양한 어휘 종류를 표현하는데 공통된 문법이 사용되는 것을 가능케 한다. 각각의 어휘종류는 다수의 정보 개념을 공유하지만 각자 특정 요건을 갖는다. 각각의 어휘종류에 적합한 소형 모델을 별도로 생성하거나 어휘교환 표준을 보다 정밀하게 세분화 한다는 것은 공통된 문법을 사용하는 것보다 유지, 이해, 상호 운용 등의 부분에서 더 많은 애로사항이 생길 수 있다.
프로파일작업은 공유된 의미 단위를 갖는 단일의 유연한 정보모델로 하여금 필요한 경우 선택적으로 적용되도록 허용한다. 프로파일 유형을 모델의 명확한 일부로 만드는 것은, 예를 들면 XML 인스턴스를 위한 보다 간편한 프로파일 유효성 검사를 가능케 하는 것이며, 이때 보다 한정적인 XML 스키마 콘트롤 문서를 사용한다.

5.2 프로파일 유형의 정의

이 장은 표준화된 부분이다. 어휘교환 표준에서 정의하는 프로파일 유형으로는 ‘lax’, ‘thesaurus’, ‘flatTokenTerms’, ‘hierarchicalTokenTerms’, ‘glossaryOrDictionary’ 가 있으며, 비프로파일 다시 말해, 완성 모델은 profileType=‘lax’ 에 의해 식별된다. 위에서 정의하는 프로파일 유형과 다른 프로파일 유형은 반드시 ‘lax’로 선언되어야 하며, 이는 소수의 요소가 사용되는 경우라도 마찬가지이다. 만약 이러한 관행 유형을 표현하고자 한다면, 이 유형에 대한 처리가 가능한 시스템으로 전달되도록 정보모델이 확장되어야 한다. 관행 유형에 대한 해석 및 처리가 불가능한 시스템은 관행 유형을 어휘교환 표준 관점에서 ‘lax’로 간주한다.

5.1 프로파일유형요약

프로파일 유형

데이터

lax 임의 요소를 이용하거나 또는 보다 제한적인 프로파일 유형으로 분류될 수 없는 유형이다. ‘lax’ 프로파일 유형은 모든 어휘교환 모델 영역에서 사용이 가능하다. 제한이 가장 적음
thesaurus 시소러스이다. ‘용어’ 데이터 컨테이너의 중복은 허용되지 않는다. 다수의 ‘캡션’과 ‘설명’ langstring 요소를 사용하여 여러 언어로 표현될 수 있다. .
hierarchicalTokenTerms 분류법으로, 용어의 주된 식별자는 언어 독립적인 token으로 ‘용어’ ‘식별자’이다. 다음의 요소들은 존재해서는 안 된다. ‘relatedTerms’(계층적 구조가 요소 통제로 표현된다) 및 ‘mediaDescriptors’(가벼운 모델에서 그 사용을 선호한다). .
glossaryOrDictionary 설명형식으로 된 일부 정보를 갖는 언어의 목록으로 연관성이 없다. ‘용어’ 데이터 콘테이너의 중복은 허용되지 않는다. 다수의 ‘캡션’과 ‘설명’ langstring 을 통해 여러 언어에서 그 의미가 동등한 대응물(equivalent)로 표현될 수 있다. 용어의 식별자는 존재하나, 모델에서는 기능하지 않는다. .
flatTokenTerms IEEE 1484-12.1-2002에서 사용되고 있는 것과 같은 token 목록이다(IEEE LOM). 이 프로파일은 ‘hierarchicalTokenTerms’ 프로파일에 ‘용어’ 는 다른 ‘용어’ 안에 포함될 수 없다는 추가 제약을 둔다. 제한 조건이 가장 많지만 가벼움
 

5.2 – 프로파일유형에서허용되고필요한요소들다중도

프로파일유형: 요소

lax

Glossary

OrDictionary

flatToken

Terms

Hierarchical

TokenTerms

thesaurus

어휘에 속한 요소
순서 중요도

0..1

0..1

0..1

0..1

0..1

프로파일 유형1

0..1

1

1

1

1

기본언어

0..1

0..1

0..1

0..1

0..1

어휘 이름

0..1

0..1

0..1

0..1

0..1

어휘 식별자

0..1

0..1

0..1

0..1

0..1

등록 상황

0..1

0

0..1

0..1

0..1

용어

1..*

1..*

1..*

1..*

1..*

관계

0..*

0..*

0

0

0..*

용어에속한요소
식별자

1

1

1

1

1

캡션2

[0..1]*

1

[0..1]*

[0..1]*

1

유효 인덱스

0..1

0

0..1

0..1

0

설명

0..1

0..1

0..1

0..1

0..1

미디어 설명자

0..*

0..*

0

0

0..*

미디어 위치

1

1

-

-

1

해석 주석

0..1

0..1

-

-

0..1

순서 중요도

0..1

-

-

0..1

-

{Term}

0..*

0

0

0..*

0

메타데이터

0..*

0..*

0..*

0..*

0..*

 
1 필수 값을 갖는 프로파일 유형은 반드시 관련 프로파일 유형에 지정된 값을 사용해야 한다. 어휘교환 모델은 특정 값이 제공되지 않은 경우 유형을 ‘lax’로 간주한다. 2 1 은 캡션의 내용물로 사용되어야만 하는 단일 langstring을 표시한다. [0..1]* 은 몇 개의 langstring 이라도 (동일한 내용물을 갖는) 캡션으로 사용될 수 있음을 나타낸다.
 
0..1 - 선택은 가능, 반복은 불가능 0..* - 선택이 가능, 반복도 가능 1..* - 적어도 한 번 이상은 필수이며 반복이 가능 1 - 한 번만 필수 0 – 사용될 수 없다
주(프로파일 활용법): 가장 제한적인 프로파일 유형은 사용 중인 요소들이 그 기능을 다하도록 충분히 선언되어야 한다.

6 시소러스 관계를 표현하기 위해 선호되는 값 영역

이 장은 표준화된 부분이다. RFC 2119에 정의된 용어들은 그 안에서만 지정되어 사용된다. 어휘교환 표준을 사용하여 표현된 단일어 시소러스는 ISO 2788에 정의된 규정을 준수해야 한다. ISO 2788를 따르는 다국어 시소러스들은 ISO 5964 권고내용을 준수해야 한다. ISO 2788 에 이어지는 단일어 시소러스는 다음의 값 영역을 사용하여 ISO 2788에 정의된 관계유형들을 표현해야 한다. 어휘 식별자: ‘http://www.imsglobal.org/vocabularies/iso2788_relations.xml’ 관계 유형의 ‘소스’를 위해 사용됨. 허용된 용어들: ‘USE’, ‘UF’, ‘RT’, ‘BT’, ‘NT’, ‘TT’ 관계 유형의 ‘값’을 위해 사용됨 용어의 의미: ISO 2788에 의해 정의됨 ISO 5964 에 이어지는 다국어 시소러스는 다음의 값 영역을 사용해서 다양한 언어에 대한 동일성 레벨을 명시해야 한다. 어휘 식별자: ‘http://www.imsglobal.org/vocabularies/iso5964_equivalences.xml’ 관계 유형의 ‘소스’를 위해 사용됨. 허용된 용어들: ‘exact’, ‘inexact’, ‘partial’, ‘singleToMultiple’, ‘NonEquivalent’ 관계 유형의 ‘값’을 위해 사용됨 용어의 의미: ISO 5964 가 정의 IMS는 이와 같은 값 영역에 대한 고정적 정의들을 위에 기재된 어휘 식별자 URL과 동일한 URL에 저장하고 관리한다. 이와 같은 정의들은 가장 최근 버전의 어휘교환 표준 XML 바인딩에 따라 표현된다. 어휘 식별자를 사용하는 어휘교환 인스턴스는 반드시 허용된 용어의 관련 목록에서 나온 값들 만을 사용해야 한다. IMS는 ‘http://www.imsglobal.org/vocabularies/’에서 정의하는 모든 어휘 식별자에 대한 지적재산권을 갖고 있으며, 이들 식별자는 IMS 글로벌 컨소시엄 이사회 권한 없이 사용되는 것을 허용하지 않는다. 사용자들은 반드시 또한 ‘IMS Persistent, Location-Independent, Resource Identifier Implementation Handbook v1.0’을 참조해야 한다. 이들 값 영역이 선호하는 사용법은 어휘교환 표준 활용 사례 및 실행가이드에 설명되어 있다. 주: 다른 관계 유형 이 장의 권고안은 언급된 ISO 기준을 따르는 시소러스와 관련해서만 적용된다. 어휘교환 표준이 다른 유형의 관계 모델을 허용하지 않는 것은 아니며, 관계 유형에 대한 값 영역 및 허용 용어에 대한 제한을 두지 않는다. 단일 시소러스와 관련한 구체적인 언급이 참고문헌 [Z39.19]에 제공된 이유는 [Z39.19]가 ISO 2788에서 사용하고 있는 지시자(indicator)의 확장을 통해 더 많은 관계를 표현할 수 있게 해주기 때문이다. 주: 다국어 시소러스 및 의미가 동일한 언어 동일한 의미를 지닌 용어의 집합인 다국어 시소러스와 그 집합들은 다양한 방식으로 연계되어 있어 관계요소의 사용을 피하겠지만, 캡션요소 내에 다국어 문자열이 포함될 수 있다. 이를 통해 정보를 보다 명확하고 간결하게 표현할 수 있다.

부속서 A

1 ISO 5127/2-1983: Documentation and information vocabulary part 2 (traditional documents).

2 The Oxford English Dictionary. Second Edition, Oxford: Clarendon Press, 1989.

3 ISO 5127/6-1983: Documentation and information: vocabulary; part 6 (documentary languages)

4 The Oxford English Dictionary. Second Edition, Oxford: Clarendon Press, 1989.

5 The Oxford English Dictionary. Second Edition, Oxford: Clarendon Press, 1989.

6 ISO 2788:1986, Guidelines for the establishment and development of monolingual thesauri. ISO 5964:1985, Guidelines for the establishment and development of multilingual thesauri.

7 The Oxford English Dictionary. Second Edition, Oxford: Clarendon Press, 1989.

8 ISO 5127/2-1983: Documentation and information: vocabulary; part 2 (traditional documents)

9 The Oxford English Dictionary. Second Edition, Oxford: Clarendon Press, 1989.

10 ISO 5127/2-1983: Documentation and information: vocabulary; part 2 (traditional documents).

11 The Oxford English Dictionary. Second Edition, Oxford: Clarendon Press, 1989.

12 I.e., the creator will not use the same identifier for another purpose and will not discard in favour of an alternative identifier.

13 The Best Practice and Implementation Guide explains this requirement.

참고문헌

[CVLOM] ‘Controlled Vocabularies for Learning Object Metadata. - Typology, impact analysis, guidelines and a web based Vocabularies Registry’. F. Van Assche, L. Anido-Rifón , L. M. Campbell and M. Willem, CEN/ISSS Learning Technologies Workshop, DRAFT, http://office.eun.org/kms/sites/cenisss/index.html
[DDC] Dewey Decimal Classification Scheme, OCLC Forest Press, http://www.oclc.org/dewey/
[IEEE LOM] IEEE 1484.12.1-2002, Standard for Learning Object Metadata, http://www.ieee.org
[IMSBUND] Using IMS Content Packaging to Package Instances of LIP and Other IMS Specifications v1.0, B.Olivier, M.McKell, IMS Global Learning Consortium, Inc., August 2001 (http://www.imsglobal.org/implementationhandbook/imspack_handv1p0.html).
[IMSPLID] IMS Persistent, Location-Independent, Resource Identifier Implementation Handbook v1.0, M.McKell, IMS Global Learning Consortium, Inc., April 2001 (http://www.imsglobal.org/implementationhandbook/imsrid_handv1p0.html).
ISO 2788 ISO 2788:1986, Guidelines for the establishment and development of monolingual thesauri.
ISO 5964 ISO 5964:1985, Guidelines for the establishment and development of multilingual thesauri.
ISO 11404 ISO 11404, Language-independent Datatypes, http://www.iso.ch/cate/d19346.html
[MESH] Medical Subject Headings, US National Library of Medicine, http://www.nlm.nih.gov/mesh/meshhome.html
[RFC 1766] Tags for the Identification of Languages, http://www.ietf.org/rfc/rfc1766.txt
[RFC 2119] IETF RFC 2119 - Key words for use in RFCs to Indicate Requirement Levels
[RFC 2396] IETF RFC 2396 Uniform Resource Identifiers (URI): Generic Syntax
[RFC3066] RFC 3066, Tags for the Identification of Languages, http://www.ietf.org/rfc/rfc3066.txt
[UDC] Universal Decimal Classification Scheme, UDC Consortium, http://www.udcc.org/
[Z39.19] ANSI/NISO Z39.19-1993, Guidelines for the Construction, Format, and Management of Monolingual Thesauri, ISSN 1041-5653

해설

이 해설은 본체 및 부속서에 규정ㆍ기재한 사항 및 이것에 관련된 사항을 설명하는 것으로 표준의 일부는 아니다. 1. 제정의 취지 이러닝 서비스 다양화 및 고도화에 따라 이러닝 표준에 대한 필요성과 수요가 나날이 급증하고 있으며, 나아가 표준화를 지향하고 있는 국내외적 요구와 환경에 대응하기 위한 기반 마련이 시급하다. 또한, 국제 이러닝 표준화 분야에서 선진국간의 치열한 경쟁이 심화되고 있는 시점에서 국내 산업 및 국가 지식경쟁력 강화를 위한 실천적 차원의 표준화 추진 사례가 부족한 실정이다. 따라서 이러닝 표준화 요소 중 글로벌 경쟁력을 갖춘 어휘 교환 표준을 우선 단체표준으로 제안함으로써 산업 경쟁력 및 교육경쟁력 강화를 도모하고자 한다. 효율적인 단체표준 개발을 위해 IMS 어휘 교환 표준을 인용하였다. 2. 제정의 경위
  • 제1차 개발위원회(2009.1.): 단체표준 개발을 위한 참여 전문가를 위촉하고 규격 제정 취지와 규격의 제정 방향을 설정하였고, 초안 작성 기준을 토의하였다.
  • 제2차 개발위원회(2009.3.): IMS GLC의 이러닝 표준을 기초로 작성한 초안을 통하여 부합화에 적합한 표준 용어를 정의하였다.
  • 제3차 개발위원회(2009.5.): 기초(안)을 작성하여 적용범위, 인용표준, 용어정의 등의 내용을 검토하고, 참여진의 표준의 이해도를 높이기 위해 규격에 대한 검수 작업을 실시 하였다.
  • 제4차 개발위원회(2009.6.): 표준 수정(안)을 토대로 IMS Korea 표준화 포럼의 표준 심사위원회를 통하여 표준을 검토하고 의견을 수렴하였다.
a) 규격서의 서식은 KS A 0001 : 2008의 규격서를 기준으로 하여 작성하였다. b) 양식은 기존의 유사 KS규격을 인용하였으며, IMS와 부합화된 최신규격을 적용하였다 3. 심의 중 주요 논의 및 수정사항
  1. 인용 표준의 형식은 KS A 0001의 구성에 맞게 조정하며, 연도는 삭제한다. (2009년 6월)
  2. 표준 규격서의 목차는 적용 범위 인용표준, 용어 정의 순으로 목차를 정렬 하며, 단, 원문에 서론이 있는 경우 서론은 유지한다. (2009년 6월)
  3. NETg, Boein Coporation와 같은 고유한 회사명은 A, B 형태의 가칭으로 대체 표기한다. (2009년 6월)
  4. 그림, 표, 본문 등에 포함된 영어를 최대한 번역하여 국문으로 표기한다. (2009년 10월)
  5. MS GLC의 표준 인용 정책에 의하여 페이지의 'IPR 공지’ 및 'IMS 로고’ 적용은 현행을 유지하며, 규격의 매 페이지마다 포함된 copyright 표기 문구는 삭제한다. (2009년 10월)
  6. 규격에 해설서(제정의 취지 등) 내용을 추가 작성한다. (2009년 10월)
4. 적용 범위 표준의 핵심 부분을 설명하며 이 정보모델을 기반으로 하는 모든 바인딩의 기준이 되는 부분을 기술한다. 의미론, 구조, 데이터 유형, 값 스페이스, 다중도, 필수여부(필수 또는 선택)와 같은 특성들에 대한 상세정보 또한 포함하고 있다. 5. 표준개발 참여자 이 규격의 초안은 IMS Korea 표준화 포럼 활동으로 작성되었으며, 규격 개발에 참여한 전문가는 다음과 같다.

표준개발 참여자(경칭생략, 무순)

성 명

근 무 처

직 위

조용상

한국교육학술정보원

팀장

김종현

계원디자인예술대학

교수

김현진

한국교원대학교

교수

정광식

한국방송통신대학교

교수

황대준

성균관대학교

교수

고영승

(주)디유넷

대리

이정우

(주)포씨소프트

차장

장근원

(주)크레듀

과장

정호원

(주)씨티유니온

차장

지승환

테크빌닷컴(주)

차장

최성기

SK C&C

과장

권영진

한국교육학술정보원

연구원

최미애

한국교육학술정보원

연구원