中文專有名詞辨識系統
更新時間: 2021-11-15 15:56:19
中文專有名詞辨識系統
本院覽號
05T-1080409
智財權狀態
專門技術
摘要
專有名詞辨識,或實體辨識(Named Entity Recognition, NER),是資訊抽取(Information Extraction, IE)的基本任務之一。其目標為在文字資料當中, 能夠辨識出感興趣的專有名詞(包含原本資料庫不存在的新專有名詞),並自動標記正確的分類,如人名、地名、組織名等等,是人工智慧當中理解語言的重要步驟。目前我們所開發的中文專有名詞辨識系統能辨識11 類一般領域專有名詞及 7 類數量詞,包含:人名、團體、設施、組織、地理、地點、商品、事件、藝術品、法律、語言、日期、時間、比例、錢、數量、序數、數詞。
線上展示網址為:https://ckip.iis.sinica.edu.tw/project/ner,歡迎實際測試。
技術優勢
- 能夠充分利用語法結構的深度學習技術
- 同時考慮字與詞的訊息
- 辨識種類多: 11 類一般領域專有名詞及 7 類數量詞
- 相關技術發表在NLP著名國際會議 - EMNLP 2017, 是當年度的state-of-the-art (Ontonotes 5.0 English NER)
應用範圍
- 大數據輿情分析
- 語言理解
- 智慧客服
- 聊天機器人
- 商品情報分析系統
圖1. CKIP NER 系統示意
圖2. CKIP NER 系統示意
創作人
馬偉雲
聯絡人
對本技術有興趣,請於本處網頁廠商選項下(廠商需求與諮詢)網頁填寫資料,承辦人將跟您聯絡。
檔案下載