多智能体机器人系统信息融合与协调

多智能体机器人系统信息融合与协调
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: ,
出版社: 科学出版社
2015-08
版次: 1
ISBN: 9787030447623
定价: 75.00
装帧: 平装
开本: 32开
纸张: 其他
页数: 188页
正文语种: 简体中文
16人买过
  • 《多智能体机器人系统信息融合与协调》提出了一种基于Markov对策的多Agent协调框架并给出了相应的算法。通过对多Agent环境的分析,在对策论框架下进行多Agent协调,重点研究了MAS中敌对平衡与协作平衡的多Agent学习算法。基于多Agent中竞争和合作的关系,设计了一种分层结构处理多Agent协调:利用零和Markov进行Agent群体之间的竞争与对抗,利用团队Markov对策完成Agent群体内部的协调与合作。机器人足球赛结果表明了本方法的可行性及优越性。 《智能科学技术著作丛书》序
    前言
    第1章绪论
    1.1引言
    1.2多机器人系统中的信息融合
    1.2.1机器人传感器系统
    1.2.2机器人多传感器信息融合
    1.3多机器人协调与合作研究现状
    1.4多Agent信息融合与协调的研究现状
    1.4.1多Agent信息融合
    1.4.2多Agent协调与合作
    1.5机器人足球及其研究进展
    1.5.1机器人足球的发展概况
    1.5.2FIRA机器人足球比赛系统
    1.5.3机器人足球的关键技术和研究热点
    1.6本书的结构和内容安排
    参考文献

    第2章多Agent的信息融合模型与方法
    2.1引言
    2.2Agent与MAS的概念及特性
    2.2.1Agent的由来及定义
    2.2.2Agent的特性
    2.2.3MAS的概念与特性
    2.2.4MAS与复杂系统
    2.2.5MAS与智能系统
    2.3信息融合技术概述
    2.3.1信息融合的概念与定义
    2.3.2信息融合的模型
    2.3.3信息融合应用与发展现状
    2.4多Agent信息融合模型
    2.4.1Agent体系结构
    2.4.2MAS体系结构
    2.4.3基于多Agent的信息融合模型
    2.5小结
    参考文献

    第3章多Agent协调的学习与对策
    3.1引言
    3.2多Agent协调的理论与方法
    3.2.1协调的基本概念
    3.2.2MAS协调及其理论
    3.3Agent的学习模型与方法
    3.3.1强化学习
    3.3.2Markov决策过程
    3.3.3Q学习算法
    3.4多Agent的协调模型
    3.4.1黑板模型
    3.4.2合同网
    3.4.3通用部分全局规划
    3.5多Agent协调的对策与学习方法
    3.5.1Markov对策概述
    3.5.2冲突博弈
    3.5.3多Agent强化学习
    3.6小结
    参考文献

    第4章基于证据推理的多Agent分布式决策
    4.1引言
    4.2证据推理理论
    4.2.1概率的几种解释及其性质
    4.2.2证据理论的数学基础
    4.2.3证据推理的基本概念
    4.2.4Dempster组合规则
    4.2.5证据决策规则
    4.2.6Dempster组合规则存在的问题
    4.3Agent信息模型
    4.3.1单支置信函数
    4.3.2基于证据推理的Agent信息模型
    4.4可传递置信模型
    4.4.1可传递置信模型的基本结构
    4.4.2辨识框架的粗分和细化
    4.4.3Pignistic概率转换
    4.5基于多Agent的分布式决策融合框架及算法
    4.5.1系统框架
    4.5.2融合中心
    4.5.3决策中心
    4.6仿真算例
    4.6.1赛场状态信息
    4.6.2对手的策略
    4.7多Agent分布式决策融合策略
    4.7.1异构融合
    4.7.2可靠性分配
    4.7.3融合处理
    4.7.4在机器人足球中的应用
    4.8小结
    参考文献

    第5章强化函数设计方法及其在学习系统的应用
    5.1引言
    5.2强化学习应用中的关键问题
    5.2.1泛化方法
    5.2.2探索与利用的权衡
    5.2.3强化函数与算法结构设计
    5.3强化学习的奖惩函数
    5.4基于平均报酬模型的强化学习算法
    5.4.1报酬模型
    5.4.2最优策略
    5.4.3基于平均报酬模型的强化学习主要算法
    5.5一种基于知识的强化函数设计方法
    5.5.1强化函数的基本设计思想
    5.5.2基于知识的强化函数
    5.5.3仿真实验
    5.6小结
    参考文献

    第6章基于分布式强化学习的多Agent协调方法
    6.1引言
    6.2多Agent强化学习基本理论
    6.2.1基于局部合作的Q学习
    6.2.2基于区域合作的Q学习
    6.2.3算法的收敛性
    6.3多Agellt强化学习方法的特性
    6.3.1多Agent强化学习理论及假设的不同
    6.3.2多Agent强化学习模型及框架的差异
    6.3.3多Agent强化学习内容的区别
    6.3.4多Agent强化学习算法设计的迥异
    6.4多Agent强化学习算法的分类与比较
    6.4.1绝对合作型多Agent强化学习算法
    6.4.2绝对竞争型多Agent强化学习算法
    6.4.3混合型多Agent强化学习算法
    6.4.4平衡型多Agent强化学习算法
    6.4.5最佳响应型多Agent强化学习算法
    6.4.6分析与比较
    6.5MAS中的分布式强化学习模型及结构
    6.5.1中央强化学习结构
    6.5.2独立强化学习结构
    6.5.3群体强化学习结构
    6.5.4社会强化学习结构
    6.6基于分布式强化学习的多Agent协调模型及算法
    6.6.1协调级
    6.6.2行为级
    6.6.3强化信息的分配
    6.6.4仿真实验
    6.7小结
    参考文献

    第7章基于Markov对策的多Agent协调
    7.1引言
    7.2多Agent交互的协调与博弈分析
    7.2.1多Agent协调与博弈的性质
    7.2.2多Agent协调失败的处理
    7.3多Agent冲突博弈强化学习模型
    7.3.1多Agent冲突博弈
    7.3.2最优策略
    7.3.3基于后悔值的Q学习模型
    7.4Nash-Q学习
    7.5零和Marl~OV对策和团队Markov对策
    7.5.1零和Markov对策
    7.5.2团队Markov对策
    7.6基于Markov对策的多Agent协调策略
    7.6.1对策框架
    7.6.2Tearn级对策
    7.6.3Member级对策
    7.6.4仿真实验
    7.7小结
    参考文献

    第8章Agent技术在机器人智能控制系统的应用
    8.1引言
    8.2智能机器人系统应用研究
    8.2.1概况
    8.2.2传统研究方法的缺陷
    8.2.3智能机器人系统的共性
    8.3开放式机器人智能控制系统应用研究
    8.3.1开放式控制系统的典型特征
    8.3.2基于PC的开放式控制系统的实现
    8.4多机器人系统应用研究
    8.4.1多机器人队形控制
    8.4.2机器人救援
    8.4.3多机器人追捕问题
    8.5总结与展望
    8.5.1总结
    8.5.2未来工作展望
    参考文献
  • 内容简介:
    《多智能体机器人系统信息融合与协调》提出了一种基于Markov对策的多Agent协调框架并给出了相应的算法。通过对多Agent环境的分析,在对策论框架下进行多Agent协调,重点研究了MAS中敌对平衡与协作平衡的多Agent学习算法。基于多Agent中竞争和合作的关系,设计了一种分层结构处理多Agent协调:利用零和Markov进行Agent群体之间的竞争与对抗,利用团队Markov对策完成Agent群体内部的协调与合作。机器人足球赛结果表明了本方法的可行性及优越性。
  • 目录:
    《智能科学技术著作丛书》序
    前言
    第1章绪论
    1.1引言
    1.2多机器人系统中的信息融合
    1.2.1机器人传感器系统
    1.2.2机器人多传感器信息融合
    1.3多机器人协调与合作研究现状
    1.4多Agent信息融合与协调的研究现状
    1.4.1多Agent信息融合
    1.4.2多Agent协调与合作
    1.5机器人足球及其研究进展
    1.5.1机器人足球的发展概况
    1.5.2FIRA机器人足球比赛系统
    1.5.3机器人足球的关键技术和研究热点
    1.6本书的结构和内容安排
    参考文献

    第2章多Agent的信息融合模型与方法
    2.1引言
    2.2Agent与MAS的概念及特性
    2.2.1Agent的由来及定义
    2.2.2Agent的特性
    2.2.3MAS的概念与特性
    2.2.4MAS与复杂系统
    2.2.5MAS与智能系统
    2.3信息融合技术概述
    2.3.1信息融合的概念与定义
    2.3.2信息融合的模型
    2.3.3信息融合应用与发展现状
    2.4多Agent信息融合模型
    2.4.1Agent体系结构
    2.4.2MAS体系结构
    2.4.3基于多Agent的信息融合模型
    2.5小结
    参考文献

    第3章多Agent协调的学习与对策
    3.1引言
    3.2多Agent协调的理论与方法
    3.2.1协调的基本概念
    3.2.2MAS协调及其理论
    3.3Agent的学习模型与方法
    3.3.1强化学习
    3.3.2Markov决策过程
    3.3.3Q学习算法
    3.4多Agent的协调模型
    3.4.1黑板模型
    3.4.2合同网
    3.4.3通用部分全局规划
    3.5多Agent协调的对策与学习方法
    3.5.1Markov对策概述
    3.5.2冲突博弈
    3.5.3多Agent强化学习
    3.6小结
    参考文献

    第4章基于证据推理的多Agent分布式决策
    4.1引言
    4.2证据推理理论
    4.2.1概率的几种解释及其性质
    4.2.2证据理论的数学基础
    4.2.3证据推理的基本概念
    4.2.4Dempster组合规则
    4.2.5证据决策规则
    4.2.6Dempster组合规则存在的问题
    4.3Agent信息模型
    4.3.1单支置信函数
    4.3.2基于证据推理的Agent信息模型
    4.4可传递置信模型
    4.4.1可传递置信模型的基本结构
    4.4.2辨识框架的粗分和细化
    4.4.3Pignistic概率转换
    4.5基于多Agent的分布式决策融合框架及算法
    4.5.1系统框架
    4.5.2融合中心
    4.5.3决策中心
    4.6仿真算例
    4.6.1赛场状态信息
    4.6.2对手的策略
    4.7多Agent分布式决策融合策略
    4.7.1异构融合
    4.7.2可靠性分配
    4.7.3融合处理
    4.7.4在机器人足球中的应用
    4.8小结
    参考文献

    第5章强化函数设计方法及其在学习系统的应用
    5.1引言
    5.2强化学习应用中的关键问题
    5.2.1泛化方法
    5.2.2探索与利用的权衡
    5.2.3强化函数与算法结构设计
    5.3强化学习的奖惩函数
    5.4基于平均报酬模型的强化学习算法
    5.4.1报酬模型
    5.4.2最优策略
    5.4.3基于平均报酬模型的强化学习主要算法
    5.5一种基于知识的强化函数设计方法
    5.5.1强化函数的基本设计思想
    5.5.2基于知识的强化函数
    5.5.3仿真实验
    5.6小结
    参考文献

    第6章基于分布式强化学习的多Agent协调方法
    6.1引言
    6.2多Agent强化学习基本理论
    6.2.1基于局部合作的Q学习
    6.2.2基于区域合作的Q学习
    6.2.3算法的收敛性
    6.3多Agellt强化学习方法的特性
    6.3.1多Agent强化学习理论及假设的不同
    6.3.2多Agent强化学习模型及框架的差异
    6.3.3多Agent强化学习内容的区别
    6.3.4多Agent强化学习算法设计的迥异
    6.4多Agent强化学习算法的分类与比较
    6.4.1绝对合作型多Agent强化学习算法
    6.4.2绝对竞争型多Agent强化学习算法
    6.4.3混合型多Agent强化学习算法
    6.4.4平衡型多Agent强化学习算法
    6.4.5最佳响应型多Agent强化学习算法
    6.4.6分析与比较
    6.5MAS中的分布式强化学习模型及结构
    6.5.1中央强化学习结构
    6.5.2独立强化学习结构
    6.5.3群体强化学习结构
    6.5.4社会强化学习结构
    6.6基于分布式强化学习的多Agent协调模型及算法
    6.6.1协调级
    6.6.2行为级
    6.6.3强化信息的分配
    6.6.4仿真实验
    6.7小结
    参考文献

    第7章基于Markov对策的多Agent协调
    7.1引言
    7.2多Agent交互的协调与博弈分析
    7.2.1多Agent协调与博弈的性质
    7.2.2多Agent协调失败的处理
    7.3多Agent冲突博弈强化学习模型
    7.3.1多Agent冲突博弈
    7.3.2最优策略
    7.3.3基于后悔值的Q学习模型
    7.4Nash-Q学习
    7.5零和Marl~OV对策和团队Markov对策
    7.5.1零和Markov对策
    7.5.2团队Markov对策
    7.6基于Markov对策的多Agent协调策略
    7.6.1对策框架
    7.6.2Tearn级对策
    7.6.3Member级对策
    7.6.4仿真实验
    7.7小结
    参考文献

    第8章Agent技术在机器人智能控制系统的应用
    8.1引言
    8.2智能机器人系统应用研究
    8.2.1概况
    8.2.2传统研究方法的缺陷
    8.2.3智能机器人系统的共性
    8.3开放式机器人智能控制系统应用研究
    8.3.1开放式控制系统的典型特征
    8.3.2基于PC的开放式控制系统的实现
    8.4多机器人系统应用研究
    8.4.1多机器人队形控制
    8.4.2机器人救援
    8.4.3多机器人追捕问题
    8.5总结与展望
    8.5.1总结
    8.5.2未来工作展望
    参考文献
查看详情
系列丛书 / 更多
多智能体机器人系统信息融合与协调
复杂系统建模理论、方法与技术
刘兴堂 著
多智能体机器人系统信息融合与协调
机器人大脑
肖南峰 编
多智能体机器人系统信息融合与协调
智能科学技术著作丛书:区间多目标进化优化理论与应用
巩敦卫、孙靖 编
多智能体机器人系统信息融合与协调
分批优化调度及差分进化算法
王海燕、王万良、徐新黎、赵燕伟 著
多智能体机器人系统信息融合与协调
生物地理学优化算法及应用
郑宇军、陈胜勇、张敏霞 著
多智能体机器人系统信息融合与协调
增强学习与近似动态规划
徐昕 著
多智能体机器人系统信息融合与协调
基于免疫理论的智能故障检测与诊断方法
田玉玲 著
多智能体机器人系统信息融合与协调
基于WLAN的位置指纹室内定位技术
陈丽娜 著
多智能体机器人系统信息融合与协调
钢铁生产调度及其人工蜂群算法研究
李俊青、潘全科、刘闯 著
多智能体机器人系统信息融合与协调
高级人工智能:第3版
史忠植 著
多智能体机器人系统信息融合与协调
智能粒子群优化计算:控制方法、协同策略及优化应用
介婧、徐新黎 著
多智能体机器人系统信息融合与协调
粒计算与数据推理
闫林、闫硕 著
相关图书 / 更多
多智能体机器人系统信息融合与协调
多智能体系统分布式协同控制 : 英文版
虞文武、温广辉、陈关荣 著
多智能体机器人系统信息融合与协调
多智能体系统保成本一致性控制
王忠、席建祥、刘延飞 著
多智能体机器人系统信息融合与协调
多智能体系统一致性协同演化控制理论与技术
纪良浩
多智能体机器人系统信息融合与协调
多智能体即时策略对抗方法与实践
苏炯铭 著
多智能体机器人系统信息融合与协调
多智能体系统一致性分析与设计
詹习生;韩清;郝莉莉;汪丽
多智能体机器人系统信息融合与协调
多智能体系统的有限时间一致性控制问题
何小燕 著
多智能体机器人系统信息融合与协调
多智能体系统的协调分析与控制
韩涛;肖波;詹习生;严怀成
多智能体机器人系统信息融合与协调
多智能体系统建模、仿真及应用()
赵春晓、魏楚元 著
多智能体机器人系统信息融合与协调
多智能体机器人系统控制及其应用
戴凤智 赵继超 宋运忠 著
多智能体机器人系统信息融合与协调
多智能体技术及应用
赵春晓、魏楚元 著
多智能体机器人系统信息融合与协调
多智能体系统群集协同控制方法及应用
张卓、张泽旭、李慧平、张守旭 著
多智能体机器人系统信息融合与协调
多智能体系统一致性与复杂网络同步控制
郭凌
您可能感兴趣 / 更多
多智能体机器人系统信息融合与协调
施工员(第三版)
范波、邱锡宏 编
多智能体机器人系统信息融合与协调
行业内合作研发的联盟结构及收益分配方式研究
范波、张明志 著
多智能体机器人系统信息融合与协调
英汉·汉英:中医中药词汇手册
范波、黄莺 编