Python深度强化学习:基于Chainer和OpenAIGym

Python深度强化学习:基于Chainer和OpenAIGym
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [日] (Hiromitsu Nishizaki) , [日] (Koji Makino) , ,
2021-12
ISBN: 9787111692584
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 228页
5人买过
  • 本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。 译者序 前言 第1章 引言  1 11 深度强化学习可以做什么  1 12 本书的结构  4 13 框架:Chainer和ChainerRL  6 14 Python的运行检查  6 15 Chainer的安装  9 16 ChainerRL的安装  12 17 模拟器:OpenAI Gym  14 第2章 深度学习  17 21 什么是深度学习  17 22 神经网络  18 23 基于Chainer的神经网络  21 231 Chainer与神经网络的对应  24 232 Chainer程序  25 233 参数设置  26 234 创建数据  27 235 定义神经网络  27 236 各种声明  28 237 显示训练状态  28 238 保存训练状态  31 239 执行训练  32 24 与其他神经网络的对应  32 241 感知器  32 242 5层神经网络(深度学习)  33 243 计算输入中的1的数量  34 25 基于深度神经网络的手写数字识别  35 251 手写数字的输入格式  36 252 深度神经网络的结构  39 253 8×8的手写数字数据  41 26 基于卷积神经网络的手写数字识别  43 261 卷积  45 262 激活函数  49 263 池化  49 264 执行  50 27 一些技巧  53 271 读取文件数据  54 272 使用训练模型  55 273 重启训练  56 274 检查权重  56 275 从文件中读取手写数字  57 第3章 强化学习  59 31 什么是强化学习  59 311 有监督学习  60 312 无监督学习  60 313 半监督学习  60 32 强化学习原理  61 33 通过简单的示例来学习  61 34 应用到Q学习问题中  63 341 状态  63 342 行动  63 343 奖励  63 344 Q值  64 35 使用Python进行训练  67 351 运行程序  67 352 说明程序  69 36 基于OpenAI Gym的倒立摆  73 361 运行程序  73 362 说明程序  74 37 如何保存和加载Q值  79 第4章 深度强化学习  81 41 什么是深度强化学习  81 42 对于老鼠学习问题的应用  83 421 运行程序  83 422 说明程序  85 423 如何保存和读取智能体模型  91 43 基于OpenAI Gym的倒立摆  91 431 运行程序  91 432 说明程序  92 44 基于OpenAI Gym的太空侵略者  97 45 基于OpenAI Gym的颠球  99 451 运行程序  101 452 说明程序  102 46 对战游戏  109 461 黑白棋  109 462 训练方法  111 463 变更盘面  121 464 黑白棋实体  121 465 如何与人类对战  123 466 卷积神经网络的应用  127 47 使用物理引擎进行模拟  128 471 物理引擎  129 472 运行程序  130 473 说明程序  131 48 物理引擎在颠球问题中的应用  132 49 物理引擎在倒立摆问题中的应用  140 410 物理引擎在机械臂问题中的应用  144 411 使用其他深度强化学习方法  151 4111 深度强化学习的类型  151 4112 将训练方法更改为DDQN  153 4113 将训练方法更改为PER-DQN  153 4114 将训练方法更改为DDPG  153 4115 将训练方法更改为A3C  155 第5章 实际环境中的应用  157 51 使用摄像机观察环境(MNIST)  157 511 摄像机设置  158 512 通过卷积神经网络对摄像机图像进行分类  160 513 使用图像大小为28×28的手写数字进行训练  163 52 实际环境中的老鼠学习问题  164 53 使用Raspberry Pi处理老鼠学习问题  168 531 环境构建  169 532 以输入输出为重点的简化  169 533 使用摄像机测量环境  176 54 使用Arduino + PC处理老鼠学习问题  181 541 环境构建  182 542 以输入输出为重点的简化  185 543 使用摄像机测量环境  193 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197 56 结语  201 附录  202
  • 内容简介:
    本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。
  • 目录:
    译者序 前言 第1章 引言  1 11 深度强化学习可以做什么  1 12 本书的结构  4 13 框架:Chainer和ChainerRL  6 14 Python的运行检查  6 15 Chainer的安装  9 16 ChainerRL的安装  12 17 模拟器:OpenAI Gym  14 第2章 深度学习  17 21 什么是深度学习  17 22 神经网络  18 23 基于Chainer的神经网络  21 231 Chainer与神经网络的对应  24 232 Chainer程序  25 233 参数设置  26 234 创建数据  27 235 定义神经网络  27 236 各种声明  28 237 显示训练状态  28 238 保存训练状态  31 239 执行训练  32 24 与其他神经网络的对应  32 241 感知器  32 242 5层神经网络(深度学习)  33 243 计算输入中的1的数量  34 25 基于深度神经网络的手写数字识别  35 251 手写数字的输入格式  36 252 深度神经网络的结构  39 253 8×8的手写数字数据  41 26 基于卷积神经网络的手写数字识别  43 261 卷积  45 262 激活函数  49 263 池化  49 264 执行  50 27 一些技巧  53 271 读取文件数据  54 272 使用训练模型  55 273 重启训练  56 274 检查权重  56 275 从文件中读取手写数字  57 第3章 强化学习  59 31 什么是强化学习  59 311 有监督学习  60 312 无监督学习  60 313 半监督学习  60 32 强化学习原理  61 33 通过简单的示例来学习  61 34 应用到Q学习问题中  63 341 状态  63 342 行动  63 343 奖励  63 344 Q值  64 35 使用Python进行训练  67 351 运行程序  67 352 说明程序  69 36 基于OpenAI Gym的倒立摆  73 361 运行程序  73 362 说明程序  74 37 如何保存和加载Q值  79 第4章 深度强化学习  81 41 什么是深度强化学习  81 42 对于老鼠学习问题的应用  83 421 运行程序  83 422 说明程序  85 423 如何保存和读取智能体模型  91 43 基于OpenAI Gym的倒立摆  91 431 运行程序  91 432 说明程序  92 44 基于OpenAI Gym的太空侵略者  97 45 基于OpenAI Gym的颠球  99 451 运行程序  101 452 说明程序  102 46 对战游戏  109 461 黑白棋  109 462 训练方法  111 463 变更盘面  121 464 黑白棋实体  121 465 如何与人类对战  123 466 卷积神经网络的应用  127 47 使用物理引擎进行模拟  128 471 物理引擎  129 472 运行程序  130 473 说明程序  131 48 物理引擎在颠球问题中的应用  132 49 物理引擎在倒立摆问题中的应用  140 410 物理引擎在机械臂问题中的应用  144 411 使用其他深度强化学习方法  151 4111 深度强化学习的类型  151 4112 将训练方法更改为DDQN  153 4113 将训练方法更改为PER-DQN  153 4114 将训练方法更改为DDPG  153 4115 将训练方法更改为A3C  155 第5章 实际环境中的应用  157 51 使用摄像机观察环境(MNIST)  157 511 摄像机设置  158 512 通过卷积神经网络对摄像机图像进行分类  160 513 使用图像大小为28×28的手写数字进行训练  163 52 实际环境中的老鼠学习问题  164 53 使用Raspberry Pi处理老鼠学习问题  168 531 环境构建  169 532 以输入输出为重点的简化  169 533 使用摄像机测量环境  176 54 使用Arduino + PC处理老鼠学习问题  181 541 环境构建  182 542 以输入输出为重点的简化  185 543 使用摄像机测量环境  193 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197 56 结语  201 附录  202
查看详情
12
相关图书 / 更多
Python深度强化学习:基于Chainer和OpenAIGym
Python和PySpark数据分析
(加)乔纳森·里乌
Python深度强化学习:基于Chainer和OpenAIGym
Python机器学习入门与实践 从深度学习到生成对抗网络GAN 深入浅出GAN生成对抗网络 实战gan TensorFlow与Keras 人工智能技术书籍
(日)大关真之
Python深度强化学习:基于Chainer和OpenAIGym
Python语言程序设计
王刚
Python深度强化学习:基于Chainer和OpenAIGym
Python代码编程 学科项目式编程(六年级)
冯建刚
Python深度强化学习:基于Chainer和OpenAIGym
Python机器学习 : 核心技术与开发实战 周志华西瓜书机器学习实战伴侣书
[美]普拉提克·乔希 著;李现伟 译者;颉腾文化 出品;阿尔伯托·阿尔塔桑切斯(美);曾小健
Python深度强化学习:基于Chainer和OpenAIGym
Python语言程序设计(微课版)
宁爱军 何志永
Python深度强化学习:基于Chainer和OpenAIGym
Python数据分析从入门到精通(第2版)
明日科技
Python深度强化学习:基于Chainer和OpenAIGym
Python数据分析与挖掘
齐福利
Python深度强化学习:基于Chainer和OpenAIGym
Python基础与应用(互联网+教育新形态一体化系列教材)
李喆时、谢家立、赵丽 编
Python深度强化学习:基于Chainer和OpenAIGym
Python数据分析与可视化项目实战
王振丽
Python深度强化学习:基于Chainer和OpenAIGym
Python爬虫从菜鸟到高手
李宁
Python深度强化学习:基于Chainer和OpenAIGym
Python程序设计基础教程
\"孙海龙 王济军\
您可能感兴趣 / 更多
Python深度强化学习:基于Chainer和OpenAIGym
你想活出怎样的人生
[日]宫崎骏 著;磨铁文化 出品
Python深度强化学习:基于Chainer和OpenAIGym
怕痛的我,把防御力点满就对了6【定制泡泡弹幕卡牌x4】高人气动画原著轻小说
[日]夕蜜柑 著;[日]狐印 绘;酷威文化 出品
Python深度强化学习:基于Chainer和OpenAIGym
OVERLORD.8半森妖精的神人(上,下)
[日]丸山黄金 著;刘晨 译
Python深度强化学习:基于Chainer和OpenAIGym
少年星象
[日]NOEYEBROW 绘;漫友文化 出品
Python深度强化学习:基于Chainer和OpenAIGym
新书开店:1000 家人气旺店的实操技巧
[日]富田英太 著;张凤 译;颉腾文化 出品
Python深度强化学习:基于Chainer和OpenAIGym
葡萄球菌(直木奖得主经典社会派推理代表作首次引进,每一个细节都是预告结局的伏笔,高节奏反转的情节令人拍案称奇。)
[日]道尾秀介
Python深度强化学习:基于Chainer和OpenAIGym
蓝色时期.9-10(赠烫金纪念画卡×2+书签×5+便签纸本×1)山口飞翔著 热血美术漫画
[日]山口飞翔 著;《蓝色时期》翻译组 译;天闻角川 出品
Python深度强化学习:基于Chainer和OpenAIGym
PLUTO冥王 001(简体中文版,“日本漫画之神—浦泽直树作品,首刷限定附赠镭射明信片一张)
[日]浦泽直树×手冢治虫
Python深度强化学习:基于Chainer和OpenAIGym
PLUTO冥王 002(简体中文版,“日本漫画之神—浦泽直树作品,首刷限定附赠镭射明信片一张)
[日]浦泽直树×手冢治虫
Python深度强化学习:基于Chainer和OpenAIGym
獾的美食奇遇(全3册精装,日本知名图画书作家安井季子、画家重森千佳联袂打造,绘本妈妈海桐推荐)
[日]安井季子/文 (日)重森千佳 图
Python深度强化学习:基于Chainer和OpenAIGym
妈妈,对不起(宫西达也图画书)表达孩子对妈妈的爱
[日]宫西达也 著;彭懿 译
Python深度强化学习:基于Chainer和OpenAIGym
大口大口地吃,好吃极了(宫西达也图画书)付诸行动,才有收获
[日]宫西达也 著;朱自强 译