智財技轉處 | 中文專有名詞辨識系統

:::

中文專有名詞辨識系統

更新時間： 2021-11-15 15:56:19

分享到：

中文專有名詞辨識系統

本院覽號

05T-1080409

智財權狀態

專門技術

摘要

專有名詞辨識，或實體辨識（Named Entity Recognition, NER），是資訊抽取（Information Extraction, IE）的基本任務之一。其目標為在文字資料當中, 能夠辨識出感興趣的專有名詞(包含原本資料庫不存在的新專有名詞)，並自動標記正確的分類，如人名、地名、組織名等等，是人工智慧當中理解語言的重要步驟。目前我們所開發的中文專有名詞辨識系統能辨識11 類一般領域專有名詞及 7 類數量詞，包含：人名、團體、設施、組織、地理、地點、商品、事件、藝術品、法律、語言、日期、時間、比例、錢、數量、序數、數詞。

線上展示網址為：https://ckip.iis.sinica.edu.tw/project/ner，歡迎實際測試。

技術優勢

能夠充分利用語法結構的深度學習技術
同時考慮字與詞的訊息
辨識種類多： 11 類一般領域專有名詞及 7 類數量詞
相關技術發表在NLP著名國際會議 - EMNLP 2017, 是當年度的state-of-the-art (Ontonotes 5.0 English NER)

應用範圍

大數據輿情分析
語言理解
智慧客服
聊天機器人
商品情報分析系統

圖1. CKIP NER 系統示意

圖2. CKIP NER 系統示意

創作人

馬偉雲

聯絡人

對本技術有興趣，請於本處網頁廠商選項下(廠商需求與諮詢)網頁填寫資料，承辦人將跟您聯絡。

檔案下載

中文專有名詞辨識系統