计算机视觉原理与实践

计算机视觉原理与实践
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2022-12
版次: 1
ISBN: 9787121447419
定价: 49.80
装帧: 其他
页数: 252页
1人买过
  • 本书结合理论和实践,主要介绍如何使用图像处理和深度学习技术来使计算机感知和理解图形。全书分为概述、OpenCV 图像基本操作、深度学习与计算机视觉、计算机视觉基础技术、计算机视觉综合应用五大部分(共 11 章)。概述部分(第 1 章)主要介绍计算机视觉的概念和发展史;OpenCV 图像基本操作(第 2 章)主要介绍基于OpenCV 的图像处理操作;深度学习与计算机视觉(第3 章)主要介绍深度学习的概念及其应用、深度学习的实现框架TensorFlow 的用法以及卷积神经网络的概念、结构和算法;计算机视觉基础技术(第4~9 章)主要介绍图像分类、目标检测、图像分割、场景文字识别、人体关键点检测、图像生成等关键技术的原理、方法及应用;计算机视觉综合应用(第 10、11 章)主要介绍视觉交互机器人和无人驾驶的自动巡线两个大型综合实验。本书围绕基本理论,设置了较多的实验操作和实践案例,通过自己动手练习,帮助读者巩固所学内容。 许桂秋,数据中国“百校工程”项目运营总监。2000年9月?D2004年6月,厦门大学,计算机科学与技术专业学习,获工学学士;2007年8月?D2011年4月,中国石油天然气股份有限公司,项目经理,工程师;2011年6月?D2016年7月,曙光信息产业股份有限公司,项目经理,工程师;主要从事大数据,人工智能等新一代信息技术领域的产教融合研究。主要著作出版情况:《大数据导论》、《Python编程基础与应用》、《NoSQL数据库原理与应用》、《数据挖掘与机器学习》等9本系列教材,浙江科技出版社,2019年。 目    录

    第1章  概述1

    1.1  什么是计算机视觉1

    1.2  计算机视觉的发展史3

    第2章  OpenCV图像基本操作6

    2.1  如何使用OpenCV6

    2.2  图像的基础操作8

    2.2.1  图像的基本表示方法8

    2.2.2  图像的读取、显示和存储11

    2.2.3  视频序列的读取和存储16

    2.2.4  图像像素的处理与访问20

    2.2.5  获取图像属性23

    2.2.6  图像RoI23

    2.2.7  图像通道的拆分与合并25

    2.3  图像的几何变换28

    2.3.1  图像缩放28

    2.3.2  图像翻转30

    2.3.3  图像仿射变换31

    2.3.4  图像透视34

    2.4  图像的算术运算35

    2.4.1  图像的加法运算35

    2.4.2  图像的加权和运算37

    2.4.3  图像的按位逻辑运算38

    第3章  深度学习与计算机视觉42

    3.1  深度学习概述42

    3.1.1  深度学习的概念42

    3.1.2  深度学习的发展历程42

    3.2  卷积神经网络45

    3.2.1  卷积神经网络的研究历史与意义45

    3.2.2  卷积神经网络的基本结构46

    3.2.3  卷积神经网络的工作原理48

    3.2.4  卷积神经网络的发展趋势49

    3.2.5  实验—机器人识别你的字50

    3.3  基于深度学习的计算机视觉56

    3.3.1  计算机视觉与深度学习的关系56

    3.3.2  计算机视觉和深度学习发展的加速器—GPU58

    3.3.3  计算机视觉与深度学习的基础与研究方向59

    3.4  深度学习的实现框架TensorFlow60

    3.4.1  TensorFlow简介60

    3.4.2  TensorFlow环境的搭建60

    3.4.3  TensorFlow计算模型—计算图68

    3.4.4  TensorFlow数据模型—张量70

    3.4.5  TensorFlow运行模型—会话74

    第4章  图像分类76

    4.1  定义与应用场景76

    4.2  实现方法77

    4.3  常用数据集80

    4.4  实验—机器人看图识物82

    4.5  实验—机器人识别人脸表情100

    第5章  目标检测112

    5.1  定义与应用场景112

    5.2  实现方法113

    5.2.1  基于候选区域的目标检测算法114

    5.2.2  基于直接回归的目标检测算法119

    5.3  常用数据集122

    5.4  实验—机器人捕捉人脸并识别123

    5.5  实验—无人驾驶中的目标检测141

    第6章  图像分割146

    6.1  定义与应用场景146

    6.2  实现方法147

    6.2.1  基于特征编码的模型147

    6.2.2  基于区域选择的模型148

    6.2.3  基于上采样/反卷积的模型150

    6.2.4  基于RNN的模型151

    6.2.5  基于提高特征分辨率的模型152

    6.3  常用数据集152

    6.4  实验—无人驾驶场景感知153

    第7章  场景文字识别165

    7.1  定义与应用场景165

    7.2  实现方法167

    7.2.1  传统方法时期167

    7.2.2  深度学习方法时期167

    7.3  常用数据集170

    7.4  实验—无人值守车牌识别机器人171

    第8章  人体关键点检测179

    8.1  定义与应用场景179

    8.1.1  人体关键点检测的定义179

    8.1.2  人体关键点检测的应用场景180

    8.2  实现方法182

    8.2.1  自顶向下183

    8.2.2  自底向上184

    8.3  常用数据集186

    8.3.1  MPII数据集187

    8.3.2  MSCOCO数据集188

    8.4  实验—姿态识别互动机器人189

    第9章  图像生成194

    9.1  定义与应用场景194

    9.1.1  图像生成的定义194

    9.1.2  图像生成的应用195

    9.2  实现方法196

    9.2.1  GAN模型196

    9.2.2  PixelRNN/PixelCNN模型197

    9.2.3  VAE模型198

    9.3  常用数据集200

    9.4  实验—机器人书法学习200

    第10章  视觉交互机器人212

    10.1  实验目的212

    10.2  实验背景212

    10.3  实验原理212

    10.4  实验环境215

    10.5  实验步骤215

    10.5.1  利用CNN主流架构的mini_Xception训练情感分类215

    10.5.2  视觉交互机器人综合实验221

    第11章  无人驾驶的自动巡线228

    11.1  实验目的228

    11.2  实验背景228

    11.3  实验原理230

    11.4  实验环境231

    11.5  实验步骤231

    11.5.1  数据准备231

    11.5.2  网络设计231

    11.5.3  模型训练237

    11.5.4  模型测试243
  • 内容简介:
    本书结合理论和实践,主要介绍如何使用图像处理和深度学习技术来使计算机感知和理解图形。全书分为概述、OpenCV 图像基本操作、深度学习与计算机视觉、计算机视觉基础技术、计算机视觉综合应用五大部分(共 11 章)。概述部分(第 1 章)主要介绍计算机视觉的概念和发展史;OpenCV 图像基本操作(第 2 章)主要介绍基于OpenCV 的图像处理操作;深度学习与计算机视觉(第3 章)主要介绍深度学习的概念及其应用、深度学习的实现框架TensorFlow 的用法以及卷积神经网络的概念、结构和算法;计算机视觉基础技术(第4~9 章)主要介绍图像分类、目标检测、图像分割、场景文字识别、人体关键点检测、图像生成等关键技术的原理、方法及应用;计算机视觉综合应用(第 10、11 章)主要介绍视觉交互机器人和无人驾驶的自动巡线两个大型综合实验。本书围绕基本理论,设置了较多的实验操作和实践案例,通过自己动手练习,帮助读者巩固所学内容。
  • 作者简介:
    许桂秋,数据中国“百校工程”项目运营总监。2000年9月?D2004年6月,厦门大学,计算机科学与技术专业学习,获工学学士;2007年8月?D2011年4月,中国石油天然气股份有限公司,项目经理,工程师;2011年6月?D2016年7月,曙光信息产业股份有限公司,项目经理,工程师;主要从事大数据,人工智能等新一代信息技术领域的产教融合研究。主要著作出版情况:《大数据导论》、《Python编程基础与应用》、《NoSQL数据库原理与应用》、《数据挖掘与机器学习》等9本系列教材,浙江科技出版社,2019年。
  • 目录:
    目    录

    第1章  概述1

    1.1  什么是计算机视觉1

    1.2  计算机视觉的发展史3

    第2章  OpenCV图像基本操作6

    2.1  如何使用OpenCV6

    2.2  图像的基础操作8

    2.2.1  图像的基本表示方法8

    2.2.2  图像的读取、显示和存储11

    2.2.3  视频序列的读取和存储16

    2.2.4  图像像素的处理与访问20

    2.2.5  获取图像属性23

    2.2.6  图像RoI23

    2.2.7  图像通道的拆分与合并25

    2.3  图像的几何变换28

    2.3.1  图像缩放28

    2.3.2  图像翻转30

    2.3.3  图像仿射变换31

    2.3.4  图像透视34

    2.4  图像的算术运算35

    2.4.1  图像的加法运算35

    2.4.2  图像的加权和运算37

    2.4.3  图像的按位逻辑运算38

    第3章  深度学习与计算机视觉42

    3.1  深度学习概述42

    3.1.1  深度学习的概念42

    3.1.2  深度学习的发展历程42

    3.2  卷积神经网络45

    3.2.1  卷积神经网络的研究历史与意义45

    3.2.2  卷积神经网络的基本结构46

    3.2.3  卷积神经网络的工作原理48

    3.2.4  卷积神经网络的发展趋势49

    3.2.5  实验—机器人识别你的字50

    3.3  基于深度学习的计算机视觉56

    3.3.1  计算机视觉与深度学习的关系56

    3.3.2  计算机视觉和深度学习发展的加速器—GPU58

    3.3.3  计算机视觉与深度学习的基础与研究方向59

    3.4  深度学习的实现框架TensorFlow60

    3.4.1  TensorFlow简介60

    3.4.2  TensorFlow环境的搭建60

    3.4.3  TensorFlow计算模型—计算图68

    3.4.4  TensorFlow数据模型—张量70

    3.4.5  TensorFlow运行模型—会话74

    第4章  图像分类76

    4.1  定义与应用场景76

    4.2  实现方法77

    4.3  常用数据集80

    4.4  实验—机器人看图识物82

    4.5  实验—机器人识别人脸表情100

    第5章  目标检测112

    5.1  定义与应用场景112

    5.2  实现方法113

    5.2.1  基于候选区域的目标检测算法114

    5.2.2  基于直接回归的目标检测算法119

    5.3  常用数据集122

    5.4  实验—机器人捕捉人脸并识别123

    5.5  实验—无人驾驶中的目标检测141

    第6章  图像分割146

    6.1  定义与应用场景146

    6.2  实现方法147

    6.2.1  基于特征编码的模型147

    6.2.2  基于区域选择的模型148

    6.2.3  基于上采样/反卷积的模型150

    6.2.4  基于RNN的模型151

    6.2.5  基于提高特征分辨率的模型152

    6.3  常用数据集152

    6.4  实验—无人驾驶场景感知153

    第7章  场景文字识别165

    7.1  定义与应用场景165

    7.2  实现方法167

    7.2.1  传统方法时期167

    7.2.2  深度学习方法时期167

    7.3  常用数据集170

    7.4  实验—无人值守车牌识别机器人171

    第8章  人体关键点检测179

    8.1  定义与应用场景179

    8.1.1  人体关键点检测的定义179

    8.1.2  人体关键点检测的应用场景180

    8.2  实现方法182

    8.2.1  自顶向下183

    8.2.2  自底向上184

    8.3  常用数据集186

    8.3.1  MPII数据集187

    8.3.2  MSCOCO数据集188

    8.4  实验—姿态识别互动机器人189

    第9章  图像生成194

    9.1  定义与应用场景194

    9.1.1  图像生成的定义194

    9.1.2  图像生成的应用195

    9.2  实现方法196

    9.2.1  GAN模型196

    9.2.2  PixelRNN/PixelCNN模型197

    9.2.3  VAE模型198

    9.3  常用数据集200

    9.4  实验—机器人书法学习200

    第10章  视觉交互机器人212

    10.1  实验目的212

    10.2  实验背景212

    10.3  实验原理212

    10.4  实验环境215

    10.5  实验步骤215

    10.5.1  利用CNN主流架构的mini_Xception训练情感分类215

    10.5.2  视觉交互机器人综合实验221

    第11章  无人驾驶的自动巡线228

    11.1  实验目的228

    11.2  实验背景228

    11.3  实验原理230

    11.4  实验环境231

    11.5  实验步骤231

    11.5.1  数据准备231

    11.5.2  网络设计231

    11.5.3  模型训练237

    11.5.4  模型测试243
查看详情
12
您可能感兴趣 / 更多
计算机视觉原理与实践
大数据处理技术基础与应用(Hadoop+Spark)
许桂秋 孙海民 胡贵恒
计算机视觉原理与实践
深度学习技术与应用
许桂秋 余洋 周宝玲
计算机视觉原理与实践
机器学习与算法应用
许桂秋
计算机视觉原理与实践
样本数据处理
许桂秋