篇名 | 資訊的組織與擷取 |
---|---|
卷期 | 12 |
並列篇名 | Organization and Extraction for Information |
作者 | 陳光華 |
頁次 | 127-141 |
關鍵字 | 資訊檢索 、 資訊擷取 、 元資料 、 Information Retrieval 、 Information Extraction 、 Metadata |
出刊日期 | 199712 |
網際網路的發展使得資訊檢索的研究進入更具挑戰性的環境,然而資訊檢索系統通常僅僅告訴使用者有哪些相闊的文件,而非真正提供使用者所需要的資 訊。資訊擷取的研究則是進一步分析文件,依據預先定義的樣版取出特定的資訊,參照於圖書館以機讀編目格式描述藏品,資訊擷取系統所稱的樣版與機讀編自格式都可視為一種元資料格式,亦即是用於描述資料的資料。本文說明元資料與資訊擷取的關係7並討論如何藉由自然語言處理的語言分析技術有效協助使用 者擷取所需要的資訊。
The development of Internet makes the researches on information retrieval more changeable. Actually, the so-called "information retrieval "is" text retrieval." It is necessary for users to find out the needed information from the retrieved texts. A higher-level task is information extraction, which extracts the information based on pre-defined templates. From the viewpoint of Library Science, these pre-defined templates are the metadata, which describes the collection of libraries in common This paper discusses the relationships between metadata and information extraction and how natural1anguage processing helps the task of information extraction