马尔可夫决策过程和动态规划

免费

直播简介

深度强化学习第一课:马尔可夫决策过程与动态规划
Markov Decision Process, Policy Evaluation, Policy Iteration, Value Iteration
 

演讲者

何戈文,弗罗里达大学计算机科学博士,本科就读于武汉大学计算机系。在ICDE,KDD, Nucleic Acids Research 发表数篇会议与期刊论文。一篇SIGMOD文章在审。  曾在Comcast Lab实习,实习期间从事实时推荐。

授课教师

何戈文,弗罗里达大学计算机科学博士,本科就读于武汉大学计算机系。在ICDE,KDD, Nucleic Acids Research 发表数篇...