세부 항목 :

분산언어자원 관리시스템 개발

 

 

 

 

 

 

목표
연구내용

 

목표

분산언어자원 관리시스템 개발의 한 단계로 분산언어자원 인터페이스의 개발이다.  이 연구는 현재까지 개발되어 온 언어자원들을 수집하고, 이 자원들을 원활히 사용하고 공유할 수 있도록 WWW환경에서 분산된 언어자원들을 구동할 수 있도록 통합 관리한다.
또한 대규모 응용 프로그램의 개발을 위한 기초적인 연구로 서로 이질적인 환경의 프로그램들 간의 상호 운용성을 지원하는 분산 언어자원 관리 시스템을 구축한다.

 

 

연구내용

연구내용은 WWW환경에서의 언어자원 통합 관리와 CORBA에 기반한 분산 언어정보처리 아키텍쳐로 크게 두가지로 나눌 수 있다.

  • WWW환경에서의 언어자원 통합 관리

    자연언어처리 기능 요소들은 제각기 특수한 응용을 위해서 개발되었기 때문에 서로 다른 능력을 보유하고 있다.  그리고, 이러한 자원들의 개발이 개발되어 왔으나 그들의 관리의 문제점으로 자원들을 분실하거나, 이용방법을 알지 못해 제대로 사용할 수 없는 경우도 많았다. 이러한 시스템을 수집하여 재사용(reuse)할 수 있도록 하고, WWW환경에서 쉽게 사용할 수 있도록 함으로써 언어자원들을 통합(integration) 관리한다.


    언어자원에는 자연언어처리를 위한 코퍼스와 사전 등이 있고, 자연언어처리 프로그램들이 있다. 본 연구에서는 CGI(Common Gateway Interface) 방식을 이용하여 웹에서 코퍼스를 접근하여 볼 수 있도록 프로그램들을 가공하여 하나의 인터페이스를 통해 관리하고, 프로그램들을 수행시킬 수 있도록 한다.  자연언어처리 요소들을 재사용 및 통합 관리를 위해서 KAIST corpus, Web 문서, 일반 문서 등 자연언어처리 데이터들에 대해서는 서버 환경을 구축하고, 기존에 개발된 자연언어처리 프로그램에 대해서는 web 실행 환경을 구축한다.  

  • CORBA에 기반한 분선 언어정보처리

    서로 다른 특성을 지닌 형태소 해석기를 객체화하여 서버 측에 둔다.  클라이언트에서 두 형태소 해석기를 이용해서 형태소 해석을 수행 후, 검색결과를 조합할 수 있다. 이 연구는 형태소 해석뿐만 아니라, 자연언어처리 요소를 객체화하여 서버화 함으로써, 여러 각도에서 자원들을 이용한 응용 시스템의 개발이 가능하게 된다.

 


  kibs 

KIBS Administrator