本院覽號:05T-1070910
創作人:馬偉雲、陳克健
智財權:營業秘密
摘要:
中文新聞語料庫,為一包含約一千四百萬字的語料庫,主要資料來源擷取自七十九年至八十年間聯合報、中國時報、自由時報及天下雜誌之文章。本語料庫得蔣經國國際學術交流基金會補助,由中央研究院資訊所中文詞知識庫小組執行及研究。
可能的應用範圍:
- 資訊檢索
- 建立辭典
- 語言分析
- 語言理解
- 訊息抽取
- 媒體比較
此項發明的優點:
本新聞語料庫內容龐大, 涵蓋完整一年的新聞, 且來自不同媒體來源, 計有聯合報、中國時報、自由時報及天下雜誌, 提供中文語言處理技術所需的豐富材料.
智財技轉處聯絡人:王靚棻 / 02-2787-2509 / jingfen@gate.sinica.edu.tw