Python深度强化学习:基于Chainer和OpenAIGym

Python深度强化学习:基于Chainer和OpenAIGym
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [日] (Hiromitsu Nishizaki) , [日] (Koji Makino) , ,
2021-12
ISBN: 9787111692584
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 228页
5人买过
  • 本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。 译者序 前言 第1章 引言  1 11 深度强化学习可以做什么  1 12 本书的结构  4 13 框架:Chainer和ChainerRL  6 14 Python的运行检查  6 15 Chainer的安装  9 16 ChainerRL的安装  12 17 模拟器:OpenAI Gym  14 第2章 深度学习  17 21 什么是深度学习  17 22 神经网络  18 23 基于Chainer的神经网络  21 231 Chainer与神经网络的对应  24 232 Chainer程序  25 233 参数设置  26 234 创建数据  27 235 定义神经网络  27 236 各种声明  28 237 显示训练状态  28 238 保存训练状态  31 239 执行训练  32 24 与其他神经网络的对应  32 241 感知器  32 242 5层神经网络(深度学习)  33 243 计算输入中的1的数量  34 25 基于深度神经网络的手写数字识别  35 251 手写数字的输入格式  36 252 深度神经网络的结构  39 253 8×8的手写数字数据  41 26 基于卷积神经网络的手写数字识别  43 261 卷积  45 262 激活函数  49 263 池化  49 264 执行  50 27 一些技巧  53 271 读取文件数据  54 272 使用训练模型  55 273 重启训练  56 274 检查权重  56 275 从文件中读取手写数字  57 第3章 强化学习  59 31 什么是强化学习  59 311 有监督学习  60 312 无监督学习  60 313 半监督学习  60 32 强化学习原理  61 33 通过简单的示例来学习  61 34 应用到Q学习问题中  63 341 状态  63 342 行动  63 343 奖励  63 344 Q值  64 35 使用Python进行训练  67 351 运行程序  67 352 说明程序  69 36 基于OpenAI Gym的倒立摆  73 361 运行程序  73 362 说明程序  74 37 如何保存和加载Q值  79 第4章 深度强化学习  81 41 什么是深度强化学习  81 42 对于老鼠学习问题的应用  83 421 运行程序  83 422 说明程序  85 423 如何保存和读取智能体模型  91 43 基于OpenAI Gym的倒立摆  91 431 运行程序  91 432 说明程序  92 44 基于OpenAI Gym的太空侵略者  97 45 基于OpenAI Gym的颠球  99 451 运行程序  101 452 说明程序  102 46 对战游戏  109 461 黑白棋  109 462 训练方法  111 463 变更盘面  121 464 黑白棋实体  121 465 如何与人类对战  123 466 卷积神经网络的应用  127 47 使用物理引擎进行模拟  128 471 物理引擎  129 472 运行程序  130 473 说明程序  131 48 物理引擎在颠球问题中的应用  132 49 物理引擎在倒立摆问题中的应用  140 410 物理引擎在机械臂问题中的应用  144 411 使用其他深度强化学习方法  151 4111 深度强化学习的类型  151 4112 将训练方法更改为DDQN  153 4113 将训练方法更改为PER-DQN  153 4114 将训练方法更改为DDPG  153 4115 将训练方法更改为A3C  155 第5章 实际环境中的应用  157 51 使用摄像机观察环境(MNIST)  157 511 摄像机设置  158 512 通过卷积神经网络对摄像机图像进行分类  160 513 使用图像大小为28×28的手写数字进行训练  163 52 实际环境中的老鼠学习问题  164 53 使用Raspberry Pi处理老鼠学习问题  168 531 环境构建  169 532 以输入输出为重点的简化  169 533 使用摄像机测量环境  176 54 使用Arduino + PC处理老鼠学习问题  181 541 环境构建  182 542 以输入输出为重点的简化  185 543 使用摄像机测量环境  193 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197 56 结语  201 附录  202
  • 内容简介:
    本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。
  • 目录:
    译者序 前言 第1章 引言  1 11 深度强化学习可以做什么  1 12 本书的结构  4 13 框架:Chainer和ChainerRL  6 14 Python的运行检查  6 15 Chainer的安装  9 16 ChainerRL的安装  12 17 模拟器:OpenAI Gym  14 第2章 深度学习  17 21 什么是深度学习  17 22 神经网络  18 23 基于Chainer的神经网络  21 231 Chainer与神经网络的对应  24 232 Chainer程序  25 233 参数设置  26 234 创建数据  27 235 定义神经网络  27 236 各种声明  28 237 显示训练状态  28 238 保存训练状态  31 239 执行训练  32 24 与其他神经网络的对应  32 241 感知器  32 242 5层神经网络(深度学习)  33 243 计算输入中的1的数量  34 25 基于深度神经网络的手写数字识别  35 251 手写数字的输入格式  36 252 深度神经网络的结构  39 253 8×8的手写数字数据  41 26 基于卷积神经网络的手写数字识别  43 261 卷积  45 262 激活函数  49 263 池化  49 264 执行  50 27 一些技巧  53 271 读取文件数据  54 272 使用训练模型  55 273 重启训练  56 274 检查权重  56 275 从文件中读取手写数字  57 第3章 强化学习  59 31 什么是强化学习  59 311 有监督学习  60 312 无监督学习  60 313 半监督学习  60 32 强化学习原理  61 33 通过简单的示例来学习  61 34 应用到Q学习问题中  63 341 状态  63 342 行动  63 343 奖励  63 344 Q值  64 35 使用Python进行训练  67 351 运行程序  67 352 说明程序  69 36 基于OpenAI Gym的倒立摆  73 361 运行程序  73 362 说明程序  74 37 如何保存和加载Q值  79 第4章 深度强化学习  81 41 什么是深度强化学习  81 42 对于老鼠学习问题的应用  83 421 运行程序  83 422 说明程序  85 423 如何保存和读取智能体模型  91 43 基于OpenAI Gym的倒立摆  91 431 运行程序  91 432 说明程序  92 44 基于OpenAI Gym的太空侵略者  97 45 基于OpenAI Gym的颠球  99 451 运行程序  101 452 说明程序  102 46 对战游戏  109 461 黑白棋  109 462 训练方法  111 463 变更盘面  121 464 黑白棋实体  121 465 如何与人类对战  123 466 卷积神经网络的应用  127 47 使用物理引擎进行模拟  128 471 物理引擎  129 472 运行程序  130 473 说明程序  131 48 物理引擎在颠球问题中的应用  132 49 物理引擎在倒立摆问题中的应用  140 410 物理引擎在机械臂问题中的应用  144 411 使用其他深度强化学习方法  151 4111 深度强化学习的类型  151 4112 将训练方法更改为DDQN  153 4113 将训练方法更改为PER-DQN  153 4114 将训练方法更改为DDPG  153 4115 将训练方法更改为A3C  155 第5章 实际环境中的应用  157 51 使用摄像机观察环境(MNIST)  157 511 摄像机设置  158 512 通过卷积神经网络对摄像机图像进行分类  160 513 使用图像大小为28×28的手写数字进行训练  163 52 实际环境中的老鼠学习问题  164 53 使用Raspberry Pi处理老鼠学习问题  168 531 环境构建  169 532 以输入输出为重点的简化  169 533 使用摄像机测量环境  176 54 使用Arduino + PC处理老鼠学习问题  181 541 环境构建  182 542 以输入输出为重点的简化  185 543 使用摄像机测量环境  193 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197 56 结语  201 附录  202
查看详情
12
相关图书 / 更多
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch实战
(印)Ashish Ranjan Jha(阿施·拉贾汉·贾)
Python深度强化学习:基于Chainer和OpenAIGym
Python游戏开发从入门到进阶实战
明日科技 编著
Python深度强化学习:基于Chainer和OpenAIGym
Pylon
Faulkner;William
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习指南:计算机视觉 卷II 王兆宇
(巴西)丹尼尔·沃格特·戈多伊
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习指南:序列与自然语言处理 卷III
(巴西)丹尼尔·沃格特·戈多伊(Daniel Voigt Godoy)
Python深度强化学习:基于Chainer和OpenAIGym
PyTorch深度学习指南:编程基础 卷I
(巴西)丹尼尔·沃格特·戈多伊
Python深度强化学习:基于Chainer和OpenAIGym
Python推荐系统实战:基于深度学习、NLP和图算法的应用型推荐系统
(印)阿克谢·库尔卡尼 等
Python深度强化学习:基于Chainer和OpenAIGym
Python金融量化实战固定收益类产品分析
欧晨
Python深度强化学习:基于Chainer和OpenAIGym
Python量子计算实践:基于Qiskit和IBM Quantum Experience平台
(美)哈西·诺伦(Hassi Norlén)
Python深度强化学习:基于Chainer和OpenAIGym
Python Streamlit从入门到实战——快速构建机器学习和数据科学Web应用(微课视频版)
王鑫
Python深度强化学习:基于Chainer和OpenAIGym
Python编程:时间序列分析入门与实战应用
王恺
Python深度强化学习:基于Chainer和OpenAIGym
Python语言科研绘图与学术图表绘制从入门到精通 科技绘图与科学可视化专业教程
关东升 编著
您可能感兴趣 / 更多
Python深度强化学习:基于Chainer和OpenAIGym
人生的愚者
[日]木木高太郎/著陈晓淇/译
Python深度强化学习:基于Chainer和OpenAIGym
这份心情总有一天会遗忘【定制回忆典藏卡*2】本屋大赏得主 我想吃掉你的胰脏作者住野夜新书
[日]住野夜 著;酷威文化 出品
Python深度强化学习:基于Chainer和OpenAIGym
明明不是我!
[日]浅仓秋成
Python深度强化学习:基于Chainer和OpenAIGym
5只好老鼠造房子(日本绘本奖作品,儿童社会性发展绘本)
[日]田代千里 著;常立 译
Python深度强化学习:基于Chainer和OpenAIGym
宴: runta插画集(赠典藏画卡×2+精美书签×4)新锐画师runta集大成作品集
[日]runta 著;天闻角川 编译
Python深度强化学习:基于Chainer和OpenAIGym
小白去露营
[日]小石有华
Python深度强化学习:基于Chainer和OpenAIGym
豆腐店
[日]饭野真纪 著;100层童书馆 出品
Python深度强化学习:基于Chainer和OpenAIGym
龟兹早期寺院中的说一切有部遗迹探真
[日]谷口阳子 著;王倩 译;[意]魏正中;[日]桧山智美 (德)基弗尔-普尔兹
Python深度强化学习:基于Chainer和OpenAIGym
森林里的西瓜虫 科学之友作者绘本大师松冈达英经典力作
[日]松冈达英 著;晓晗 译
Python深度强化学习:基于Chainer和OpenAIGym
再见,我们的幼儿园(精装 宫西达也系列绘本)回顾宝贵的幼儿园生活,让孩子更好地迎接一年级。
[日]宫西达也
Python深度强化学习:基于Chainer和OpenAIGym
小小熊猫(精装 宫西达也系列绘本)超萌小小熊猫,生活充满惊险,怎么化险为夷?
[日]宫西达也
Python深度强化学习:基于Chainer和OpenAIGym
草莓村(蜡笔王国系列)(日本畅销七十年,“宫崎骏式”自然主义儿童文学的经典之作!)
[日]福永令三