欢迎来到《REVIVE使用指南》。本仓库包含了书中的所有代码示例、数据集以及相关资源,帮助您更好地理解和应用REVIVE进行工业决策。
- 前言
- 1.1 工业决策任务场景
- 1.2 工业决策任务存在的难点
- 1.3 REVIVE简介
- 背景知识
- 2.1 有向无环图(DAG)
- 2.2 因果分析
- 2.3 强化学习
- 2.3.1 马尔可夫决策过程(MDP)
- 2.3.2 强化学习
- 2.3.4 离线强化学习
- REVIVE入门和案例展示
- 3.1 业务分析
- 3.3 决策流图构建
- 3.4 数据准备
- 3.5 虚拟环境构建
- 3.6 虚拟环境检验评估
- 3.7 策略模型训练
- 3.8 策略模型检验评估
- 3.9 模型上线部署
- 高级功能
- 4.1 外部变量
- 4.2 专家函数
- 4.3 多时间步节点拼接
- 案例展示
- 5.1 机器人运动控制
- 5.2 冰箱恒温控制器
- 5.3 着陆器悬停任务
- 5.4 弹簧-阻尼系统控制
- 5.5 管道流量控制
- 5.6 人体血糖稳定控制
- 5.7 托克马克装置控制
- 5.8 飞行器轨迹克隆
- 经验总结