iCorpus: 台華語新聞語料庫
更新時間: 2020-07-08 21:13:20
iCorpus: 台華語新聞語料庫
本院覽號
05T-1070906
公告日期
2019-02-22
智財權狀態
Know-how
摘要
iCorpus的內容為將擷取民視新聞報導的華文文字稿逐句翻譯為台文。內容收集有新聞報導3,266則, 共83,544句。台語與華語各約50萬詞、100萬字。
技術優勢
- iCorpus 是少數大量的華台平行語料之一,尤其是內容為新聞報導,可以收集到新產生的台語與華語語彙。
應用範圍
- 華、台兩種語言自動翻譯之研究與系統開發。
圖1. iCorpus 台華新聞語料庫目錄
圖2. iCorpus 台華新聞語料庫內容頁
創作人
陳孟彰、何澤政、高明達
聯絡人
對本技術有興趣,請於本處網頁廠商選項下(廠商需求與諮詢)網頁填寫資料,承辦人將跟您聯絡。
檔案下載