网络研讨会:如何对机器学习进行策略训练(使用仿真及深度强化学习)

网络研讨会:如何对机器学习进行策略训练(使用仿真及深度强化学习)

本次研讨会演示了仿真环境在深度强化学习中的应用。下面提供了会议视频和补充材料,您可以使用这些材料亲自尝试并探索更多的可能性。

会议视频提供了如下分步指南:

  • 建立状态图模型作为训练环境
  • 将模型作为独立应用程序导出并导入IntelliJ
  • 训练控制机器学习的策略
  • 最终将经过训练的策略导入到仿真模型以进行评估

本次网络研讨会的重点不是教授深度强化学习,而是关注如何使用AnyLogic构建可用于人工智能的仿真训练环境和测试平台。


如何对机器学习进行策略训练 YouKuYouTube

网络研讨会视频内容

  1. 简要介绍仿真建模和AnyLogic仿真软件。
  2. 状态图介绍(小型培训)
  3. 模型定义和概述
  4. 构建状态图模型作训练环境的分步说明 。该模型使用状态图、扩展版本的状态图和可视化的结构,支持对事件和时间驱动的行为进行建模。
  5. 导出模型并将其添加到IDE(Intellij)内的工作流中。
  6. 利用强化学习Java(RL4J)库使智能体学习一个策略,该策略采取必要的行动序列以达到期望的状态。
  7. 将经过训练的策略作为测试平台导入AnyLogic模型。研讨会上半部分介绍的状态图模型作为训练环境,将指导学习型智能体采取适当行动以达到最佳状态。
  8. Q&A

AI webinar statechart for DRL


AI Webinar Materials Download


下载内容:

  • 在AnyLogic中创建的状态图模型 (包括模型文件夹中的学习策略)。
  • 导出的状态图模型的完整内容(如果您没有AnyLogic专业版,则需要此文件)。
  • 在IntelliJ中创建的项目:包括代码,必要的库和学习策略。
  • RL4J库(深度学习库)用于训练和测试平台(模型)。这是完整RL4J库(深度学习库)的一个子部分,由DQN算法和可在任何操作系统上运行的依赖项组成。
    请注意,如果从AL模型或IntelliJ项目中删除了RL4J库(深度学习库),则需要将其作为依赖项添加回来。您可以遵循网络研讨会录制的视频说明来完成这个设置,AnyLogic (网络研讨会中的54:40) 或 IntelliJ (网络研讨会中的47:10)
  • 涵盖训练中使用的代码的文档,提供有关所使用的变量/函数的信息。

以上资料与网络研讨会的视频记录相结合,涵盖了重现整个训练设置所需的全部内容。

非常感谢所有参与此次探索在仿真建模环境中使用深度强化学习训练机器控制策略的人。

获取更多内容,请访问我们的 人工智能 页面,查看其他带有源文件和文档的示例RL(强化学习)模型。

相关文章