教育部「台灣台語語料庫應用檢索系統」上線,有助本土語言發展與AI應用
(台灣TB新聞網/資深記者劉志成)教育部委託國家教育研究院建置「台灣台語語料庫應用檢索系統」(網址:https://tggl.naer.edu.tw/)已公布供各界運用,系統查檢的資訊可供國民中小學課程設計、教學與評量需求外,供下載的語料庫也可作為語音處理或輔助教學的AI開發基礎。
為了全力支持本土語言研究,教育部於112年委託國家教育研究院建置及維護台灣台語語音語料庫相關計畫,將語料庫的成果加以保存、維護,並增錄教育部辭典及盧廣誠先生編《華台對照詞典》的例句,延伸建立「台灣台語語料庫應用檢索系統」,包含3大子系統:
一、語料檢索系統:使用者可查詢超過5萬6,000筆台灣台語語料內容,並取得檢索詞彙的搭配詞、關聯詞及部分語音檔。
二、教科書詞彙檢索系統:收錄約1,400條教科書詞彙,使用者可查詢各版本台灣台語教科書中出現的詞彙及相關資訊,可供教師利用,豐富教學內容。
三、語法點檢索系統:使用者可查詢台灣台語語法點及其說明與例句,有助於深入學習,並供語言研究者參考。
此外,開放各界申請下載108年教育部辦理台灣台語語音語料庫計畫成果,包括語料庫、音檔及AI工具模型等。內容包含2萬6千餘句的文字,每句有4至6位發音人共6種聲音來源的音檔總計208小時,另有語音處理的AI工具模型。各項成果適合語言研究者應用在語料及文本分析等相關領域,以及資訊人員用以開發語音辨識、語音合成等相關AI系統,或進一步建置本土語言教學輔助工具。有意申請者請至網站首頁,點擊右上方「語料申請」進入申請頁面,填畢基本資訊按「送出」,可於所填的電子信箱收到申請書檔案,填寫完申請書並簽名後將掃描檔回傳,維護團隊於審核通過後寄送語料庫成果下載連結(七日內有效)予申請人。
教育部為大規模保存台灣台語語料,精進既有成果,自111年11月起委請國立陽明交通大學辦理新一階段的台灣台語語料庫建置計畫,預計至115年10月完成,將擴大建置約文字語料2,000萬字及口語語料3,000小時的語料庫,並持續提高語音處理AI工具的實用效能,期望為本土語言研究、教學資源建置以及語言AI系統的開發貢獻更多力量。
- 產業新聞-11-06- 守護森林生態 振興山村經濟 首波林下經濟產品驗
- 綜合新聞-11-06- AI世代科學接軌國際!板橋高中組成36人科學菁英
- 綜合新聞-11-06- 原鄉文化結合風險管理 24位教師深入泰雅族福山
- 綜合新聞-11-06- 成淵高中129周年校慶—「成淵寶貝,9是你了!」
- 綜合新聞-11-06- 「我想讓他們變得勇敢」 萬興小女孩捐髪傳遞
- 綜合新聞-11-06- 2025台灣國際學生創意設計大賽獲獎名單揭曉
- 綜合新聞-11-06- 全台訓育、社團活動組長齊聚!聚焦民主教育與
- 綜合新聞-11-06- 普特共推融合社群 打造次世代教師專業能力
- 綜合新聞-11-06- 內中三八,璀璨年華-內湖高中38週年校慶
- 綜合新聞-11-06- 「校慶五八、友誼盛發」大理高中國際交流新聞

台灣首度主辦APSC
《學生週刊》攜手
社團法人臺灣一元
陳力瑜:愛要及時
十年築基 啟航新程
極炊®助攻牛肉麵節
冠軍建材研發處協理林仁雄:陶瓷工
基隆長庚紀念醫院眼科主任莊蘭馨:
新店耕莘醫院內科部主任裴馰:三高
萬寶週刊社長朱成志:投資資訊‧社
林口長庚醫院臨床毒物中心主任顏宗
立法委員王育敏:社會福利‧福國利
YouTube