|
早稲田大学
亀山 渉
教授
機関別共同研究
Discovery Saga
論文分野別Discovery Saga
研究テーマDiscovery Saga
協賛企業
共同研究先:Institute of Information Technology
Academic
共同研究数 1
Conference Paper
2007
IEEE : Institute of Electrical and Electronics Engineers
A proposal of Ontology-based health care information extraction system: VnHIES
(Last author)
オントロジーに基づくヘルスケア情報抽出システムの提案 VnHIES
Tran Quoc Dung, Wataru Kameyama
【抄録】
This paper presents an Ontology-based health care information extraction system - VnHIES. In the system, we develop and use two effective algorithms called "Semantic Elements Extracting Algorithm" and "New Semantic Elements Learning Algorithm" for health care semantic words extraction and ontology enhancement. The former algorithm will extract Concepts (Cs), Descriptions of concepts (Ds), Pairs of Concept and Description(C-D) and Names of diseases (Ns) in health care information domain from web pages. Those extracted semantic elements are used by latter algorithm that will render suggestions in which might contain new semantic elements for later use by domain users to enrich ontology. After extracting semantic elements, a "Document Weighting Algorithm" is applied to get summary information of document with respect to all extracted semantic words and then to be stored in knowledge base which contains ontology and database to be used later in other applications. Our experiment results show that the approach is very optimistic with high accuracy in semantic extracting and efficiency in ontology upgrade. VnHIES can be used in many health care information management systems such as medical document classification, health care information retrieval system. VnHIES is implemented in Vietnamese language. © 2007 IEEE.
【抄録日本語訳】
本論文では、オントロジーに基づく医療情報抽出システム-VnHIES-を紹介する。本システムでは、ヘルスケアの意味語抽出とオントロジー拡張のために、「意味要素抽出アルゴリズム」と「新意味要素学習アルゴリズム」という2つの効果的なアルゴリズムを開発し、使用している。前者は、ウェブページからヘルスケア情報領域における概念(Cs)、概念の説明(Ds)、概念と説明のペア(C-D)、病名(Ns)を抽出するものである。これらの抽出された意味要素は、後者のアルゴリズムによって使用され、後にドメインユーザがオントロジーを充実させるために使用する新しい意味要素を含むかもしれない提案をレンダリングする。意味要素の抽出後、「文書重み付けアルゴリズム」を適用し、抽出されたすべての意味単語に関する文書の要約情報を取得し、後に他のアプリケーションで使用するためにオントロジーとデータベースを含む知識ベースに格納する。実験の結果、本アプローチは意味抽出の精度が高く、オントロジー更新の効率も高く、非常に有望であることが示された。VnHIESは、医療文書の分類や医療情報の検索システムなど、多くの医療情報管理システムで利用することができる。VnHIESはベトナム語で実装されている。© 2007 IEEE.