Python深度强化学习:基于Chainer和OpenAIGym

Python深度强化学习:基于Chainer和OpenAIGym
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [日] (Hiromitsu Nishizaki) , [日] (Koji Makino) , ,
2021-12
ISBN: 9787111692584
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 228页
5人买过
  • 本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。 译者序 前言 第1章 引言  1 11 深度强化学习可以做什么  1 12 本书的结构  4 13 框架:Chainer和ChainerRL  6 14 Python的运行检查  6 15 Chainer的安装  9 16 ChainerRL的安装  12 17 模拟器:OpenAI Gym  14 第2章 深度学习  17 21 什么是深度学习  17 22 神经网络  18 23 基于Chainer的神经网络  21 231 Chainer与神经网络的对应  24 232 Chainer程序  25 233 参数设置  26 234 创建数据  27 235 定义神经网络  27 236 各种声明  28 237 显示训练状态  28 238 保存训练状态  31 239 执行训练  32 24 与其他神经网络的对应  32 241 感知器  32 242 5层神经网络(深度学习)  33 243 计算输入中的1的数量  34 25 基于深度神经网络的手写数字识别  35 251 手写数字的输入格式  36 252 深度神经网络的结构  39 253 8×8的手写数字数据  41 26 基于卷积神经网络的手写数字识别  43 261 卷积  45 262 激活函数  49 263 池化  49 264 执行  50 27 一些技巧  53 271 读取文件数据  54 272 使用训练模型  55 273 重启训练  56 274 检查权重  56 275 从文件中读取手写数字  57 第3章 强化学习  59 31 什么是强化学习  59 311 有监督学习  60 312 无监督学习  60 313 半监督学习  60 32 强化学习原理  61 33 通过简单的示例来学习  61 34 应用到Q学习问题中  63 341 状态  63 342 行动  63 343 奖励  63 344 Q值  64 35 使用Python进行训练  67 351 运行程序  67 352 说明程序  69 36 基于OpenAI Gym的倒立摆  73 361 运行程序  73 362 说明程序  74 37 如何保存和加载Q值  79 第4章 深度强化学习  81 41 什么是深度强化学习  81 42 对于老鼠学习问题的应用  83 421 运行程序  83 422 说明程序  85 423 如何保存和读取智能体模型  91 43 基于OpenAI Gym的倒立摆  91 431 运行程序  91 432 说明程序  92 44 基于OpenAI Gym的太空侵略者  97 45 基于OpenAI Gym的颠球  99 451 运行程序  101 452 说明程序  102 46 对战游戏  109 461 黑白棋  109 462 训练方法  111 463 变更盘面  121 464 黑白棋实体  121 465 如何与人类对战  123 466 卷积神经网络的应用  127 47 使用物理引擎进行模拟  128 471 物理引擎  129 472 运行程序  130 473 说明程序  131 48 物理引擎在颠球问题中的应用  132 49 物理引擎在倒立摆问题中的应用  140 410 物理引擎在机械臂问题中的应用  144 411 使用其他深度强化学习方法  151 4111 深度强化学习的类型  151 4112 将训练方法更改为DDQN  153 4113 将训练方法更改为PER-DQN  153 4114 将训练方法更改为DDPG  153 4115 将训练方法更改为A3C  155 第5章 实际环境中的应用  157 51 使用摄像机观察环境(MNIST)  157 511 摄像机设置  158 512 通过卷积神经网络对摄像机图像进行分类  160 513 使用图像大小为28×28的手写数字进行训练  163 52 实际环境中的老鼠学习问题  164 53 使用Raspberry Pi处理老鼠学习问题  168 531 环境构建  169 532 以输入输出为重点的简化  169 533 使用摄像机测量环境  176 54 使用Arduino + PC处理老鼠学习问题  181 541 环境构建  182 542 以输入输出为重点的简化  185 543 使用摄像机测量环境  193 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197 56 结语  201 附录  202
  • 内容简介:
    本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。
  • 目录:
    译者序 前言 第1章 引言  1 11 深度强化学习可以做什么  1 12 本书的结构  4 13 框架:Chainer和ChainerRL  6 14 Python的运行检查  6 15 Chainer的安装  9 16 ChainerRL的安装  12 17 模拟器:OpenAI Gym  14 第2章 深度学习  17 21 什么是深度学习  17 22 神经网络  18 23 基于Chainer的神经网络  21 231 Chainer与神经网络的对应  24 232 Chainer程序  25 233 参数设置  26 234 创建数据  27 235 定义神经网络  27 236 各种声明  28 237 显示训练状态  28 238 保存训练状态  31 239 执行训练  32 24 与其他神经网络的对应  32 241 感知器  32 242 5层神经网络(深度学习)  33 243 计算输入中的1的数量  34 25 基于深度神经网络的手写数字识别  35 251 手写数字的输入格式  36 252 深度神经网络的结构  39 253 8×8的手写数字数据  41 26 基于卷积神经网络的手写数字识别  43 261 卷积  45 262 激活函数  49 263 池化  49 264 执行  50 27 一些技巧  53 271 读取文件数据  54 272 使用训练模型  55 273 重启训练  56 274 检查权重  56 275 从文件中读取手写数字  57 第3章 强化学习  59 31 什么是强化学习  59 311 有监督学习  60 312 无监督学习  60 313 半监督学习  60 32 强化学习原理  61 33 通过简单的示例来学习  61 34 应用到Q学习问题中  63 341 状态  63 342 行动  63 343 奖励  63 344 Q值  64 35 使用Python进行训练  67 351 运行程序  67 352 说明程序  69 36 基于OpenAI Gym的倒立摆  73 361 运行程序  73 362 说明程序  74 37 如何保存和加载Q值  79 第4章 深度强化学习  81 41 什么是深度强化学习  81 42 对于老鼠学习问题的应用  83 421 运行程序  83 422 说明程序  85 423 如何保存和读取智能体模型  91 43 基于OpenAI Gym的倒立摆  91 431 运行程序  91 432 说明程序  92 44 基于OpenAI Gym的太空侵略者  97 45 基于OpenAI Gym的颠球  99 451 运行程序  101 452 说明程序  102 46 对战游戏  109 461 黑白棋  109 462 训练方法  111 463 变更盘面  121 464 黑白棋实体  121 465 如何与人类对战  123 466 卷积神经网络的应用  127 47 使用物理引擎进行模拟  128 471 物理引擎  129 472 运行程序  130 473 说明程序  131 48 物理引擎在颠球问题中的应用  132 49 物理引擎在倒立摆问题中的应用  140 410 物理引擎在机械臂问题中的应用  144 411 使用其他深度强化学习方法  151 4111 深度强化学习的类型  151 4112 将训练方法更改为DDQN  153 4113 将训练方法更改为PER-DQN  153 4114 将训练方法更改为DDPG  153 4115 将训练方法更改为A3C  155 第5章 实际环境中的应用  157 51 使用摄像机观察环境(MNIST)  157 511 摄像机设置  158 512 通过卷积神经网络对摄像机图像进行分类  160 513 使用图像大小为28×28的手写数字进行训练  163 52 实际环境中的老鼠学习问题  164 53 使用Raspberry Pi处理老鼠学习问题  168 531 环境构建  169 532 以输入输出为重点的简化  169 533 使用摄像机测量环境  176 54 使用Arduino + PC处理老鼠学习问题  181 541 环境构建  182 542 以输入输出为重点的简化  185 543 使用摄像机测量环境  193 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197 56 结语  201 附录  202
查看详情
12
相关图书 / 更多
Python深度强化学习:基于Chainer和OpenAIGym
Python游戏开发从入门到进阶实战
明日科技 编著
Python深度强化学习:基于Chainer和OpenAIGym
Python财务数据分析微课版
徐万紫
Python深度强化学习:基于Chainer和OpenAIGym
Python数值分析算法实践
王娟
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习指南:计算机视觉 卷II 王兆宇
(巴西)丹尼尔·沃格特·戈多伊
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习指南:序列与自然语言处理 卷III
(巴西)丹尼尔·沃格特·戈多伊(Daniel Voigt Godoy)
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习与企业级项目实战
宋立桓 宋立林
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习指南:编程基础 卷I
(巴西)丹尼尔·沃格特·戈多伊
Python深度强化学习:基于Chainer和OpenAIGym
Python数据分析快速上手
王靖、商艳红、张洪波、卢军
Python深度强化学习:基于Chainer和OpenAIGym
Python在结构动力计算中的应用
龙晓鸿 等
Python深度强化学习:基于Chainer和OpenAIGym
Python量子计算实践:基于Qiskit和IBM Quantum Experience平台
(美)哈西·诺伦(Hassi Norlén)
Python深度强化学习:基于Chainer和OpenAIGym
Python服务端测试开发实战
无涯
Python深度强化学习:基于Chainer和OpenAIGym
Python贝叶斯建模与计算
[阿根廷] 奥斯瓦尔多·A. 马丁(Osvaldo A. Martin),[美]拉万·库马尔(Ravin Kumar)[美]劳俊鹏(Junpeng Lao)著 郭涛 译
您可能感兴趣 / 更多
Python深度强化学习:基于Chainer和OpenAIGym
跃动青春7(没有遗憾的青春,每一页都有新的成长!共鸣拉满,治愈值MAX!跃动青春,快乐与幸福常在!)
[日]高松美咲 著;博集天卷 出品
Python深度强化学习:基于Chainer和OpenAIGym
跃动青春8(没有遗憾的青春,每一页都有新的成长!共鸣拉满,治愈值MAX!跃动青春,快乐与幸福常在!)
[日]高松美咲 著;博集天卷 出品
Python深度强化学习:基于Chainer和OpenAIGym
蓝色禁区.5-6(赠烫金贴纸×3,扑克牌风镭射小卡×5)动画《蓝色监狱》原作 热血足球漫画
[日]金城宗幸 原作;《蓝色禁区》翻译组 译;[日]野村优介 编绘
Python深度强化学习:基于Chainer和OpenAIGym
跃动青春9(没有遗憾的青春,每一页都有新的成长!共鸣拉满,治愈值MAX!跃动青春,快乐与幸福常在!)
[日]高松美咲 著;博集天卷 出品
Python深度强化学习:基于Chainer和OpenAIGym
3只小松鼠喂小鸟/3只小松鼠系列
[日]岩村和朗 著;彭懿、周龙梅 译
Python深度强化学习:基于Chainer和OpenAIGym
献给美亚的珍珠(日本SF大赏、星云奖、《科幻杂志》读者奖得主梶尾真治唯美、哀伤、温情、治愈的科幻爱情小说集!)
[日]梶尾真治
Python深度强化学习:基于Chainer和OpenAIGym
民间传说与现代人的深层心理
[日]河合隼雄 著,河合俊雄 编,吴松梅 译
Python深度强化学习:基于Chainer和OpenAIGym
密室王国
[日]柄刀一
Python深度强化学习:基于Chainer和OpenAIGym
小狗尼尼(全2册):小狗尼尼的春与夏+小狗尼尼的秋与冬(唯美治愈的自然观察绘本,带孩子从大自然的生命力中汲取向上的能量)
[日]秋草爱
Python深度强化学习:基于Chainer和OpenAIGym
诺奖作家给孩子的阅读课·情感启蒙(3-9年级,莫言余华的文学启蒙,垫高阅读起点,提升作文能力)
[日]川端康成等
Python深度强化学习:基于Chainer和OpenAIGym
全新正版图书 TOP5%精英的时间管理秘诀越川慎司浙江科学技术出版社9787573911544
[日]越川慎司
Python深度强化学习:基于Chainer和OpenAIGym
奶油,你肯定能行!(宫西达也的哲思绘本)萌猫幽默生活哲思,轻松解压,积极思考!
[日]宫西达也 著;彭懿 译