資料科學大講堂-從自然語言到文字探勘

活動簡介

資料探勘是資料科學中的基礎科目,這個科目總讓大部分的人有個錯覺:以為學了這門課以後,就可以從雜亂、巨大的資料中抽取出有意義的知識。然而實際上,即使上完了資料探勘課卻仍然發現資料往往混亂、難以著手,無法真正從透過資料探勘技術得到有價值的知識。

為甚麼?大部份的資料探勘或機器學習方法其實都是利用數值資料,文字資料要分析、整理往往要經過許多前處理,才有可能挖掘文字中的深層知識,即使是同一批文字資料,透過不同處理方式能得到的資訊常常差異甚大。在本門課中, 將會分享自然語言處理以及文字探勘技術的入門知識。引領資料工作者:分析、整理原始文字資料,針對文字、與待解問題的特性,找到適合的轉換方式。

 

 

 

2018 年 11 月 10 日 (星期六) 9:00 – 17:00

位於第三國際會議廳(資訊電機館2樓)

 

 

講者簡介

 

陳宜欣 (Yi-Shin Chen)

國立清華大學資訊工程學系 / 副教授

美國南加州大學資訊科學博士, 自大學與碩士時期在管理學院的薰陶, 始終相信:好的科技技術應該蘊涵著人文關懷。 帶領來自世界各地的研究團隊成員, 致力運用資料分析技術來找 出大數據背後的群眾智慧, 最近將焦點放在跨語系情緒與心理分析技術、 以及將資料科學技術應用在音樂治療上。 研究之餘,協助實驗教育的照海華德福建校, 並執筆人氣部落格『 教書匠的夢想 』。

 

議程


9:00 - 9:30報到
9:30-10:30自然語言簡介
10:30-10:50Tea Break
10:50 - 12:30自然語言技術介紹
12:30 - 13:30午餐
13:30 - 15:10文字探勘簡介
15:10 - 15:30Tea Break
15:30 - 17:00文字探勘實例分享

 

活動場地路線圖


 

立刻報名

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *