和大师的们的思想碰撞 登录 注册
加入支持让我们有继续维护的动力!会员畅享查看所有预告 立即购买

金融工程研究中心学术报告:Policy Iteration Reinforcement Learning Method for Continuous-time Mean-Field Linear-Quadratic Optimal Problem


来源:
学校官网

收录时间:
2024-04-09 13:20:30

时间:

地点:

报告人:

学校:
-/-

关键词:

简介:

-/- 115
报 告 人: 李娜 教授, 山东财经大学   报告时间:2024年4月8日下午2: 30 - 3: 30   报告地点:苏州大学本部览秀楼105学术报告厅   报告摘要:This work employs a policy iteration reinforcement learning (RL) method to investigate continuous-time mean-field linear quadratic problems over an infinite horizon. The drift and diffusion terms in the dynamics involve the state as well as the control. The stability and convergence of the RL algorithm are examined using a Lyapunov Recursion. Instead of solving a pair of coupled Riccati equations, the RL technique focuses on strengthening an auxiliary function and the cost functional as the objective functions and updating the new policy to compute the optimal control via state trajectories. A numerical example sheds light on the established theoretical results.   报告人简介:李娜,二级教授,博士生导师,青年长江学者,首届山东省科学技术青年奖获得者、首届山东数学会青年数学奖获得者,山东财经大学统计与数学学院副院长;兼任山东省科协第十届委员会委员、中国自动化学会TCCT随机系统控制委员会委员、山东省大数据研究会理事、《Math Review》评论员等。近年来,在控制论领域国际三大顶级期刊《SIAM Journal on Control and Optimization》、《Automatica》、《IEEE Transactions on Automatic Control》等国际著名学术期刊发表高水平论文20余篇;先后主持国家自然科学基金项目3项、山东省自然科学基金项目2项、山东省高等学校科技项目2项;曾获山东省高等学校科学技术奖二等奖1项、山东省省级教学成果二等奖3项;主持教育部供需对接就业育人项目1项、产学合作协同育人项目2项、山东省研究生教育优质课程建设项目1项、山东省本科教学改革研究重点项目1项。

购买下会员支持下吧...用爱发电已经很久了 立即购买

更多讲座报告

邮件提醒 短信提醒

本文节选自学校官网,仅提供聚合查看,所有立场、观点等不代表本站立场。