逢甲資料科學大講堂 – 增強學習初探以及最新發展趨勢

活動簡介

增強學習 (Reinforcement Learning) 近年來搭配深度網路,讓電腦在學習打電動、下圍棋、以及操控機器人的應用上獲得超乎預期的成果。

本課程從經典的 Markov Decision Process (MDP) 開始,先介紹傳統增強學習的算法,之後逐步講解著名的 Deep Q-Network (DQN) 以及 Policy Gradient (PG) 演算法。最後分享相關領域最新研究發展以及使用增強學習的小訣竅。

 

講者簡介

孫民 (Min Sun)

國立清華大學電機工程學系 / 助理教授

孫民博士目前任教於國立清華大學電機系,他擁有史坦福電機碩士 (導師為吳恩達)、密西根安雅堡電機系統組博士 (先後導師為李飛飛以及Silvio Savarese)、以及西雅圖華盛頓大學計算機工程博士後的經歷。他的研究興趣在電腦視覺、機器學習、以及人機互動領域。近年來基於深度學習在電腦視覺的突破,他致力於開發橫跨人工智慧不同子領域的系統,如自動影片文字描述 (視覺 x 自然語言)、以及與人類行為互動的智慧機器 (視覺 x 控制)。相關資訊請參考 aliensunmin.github.io

 

議程


9:00 - 9:30報到
9:30-10:30MDP 以及傳統增強學習的算法
10:30-10:50Tea Break
10:50 - 12:30不需環境資訊 (Model-free) 的增強學習 (包含 DQN)
12:30 - 13:30午餐
13:30 - 15:10直接優化動作政策 (Action Policy) 的 (PG) 演算法
15:10 - 15:30Tea Break
15:30 - 17:00最新研究發展以及使用增強學習的小訣竅

 

活動場地路線圖

位於第一國際會議廳(丘逢甲紀念館2樓)


立刻報名

 

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *