深度学习处理结构化数据实战

深度学习处理结构化数据实战
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [加拿大]
2022-01
版次: 1
ISBN: 9787302591290
定价: 79.80
装帧: 其他
开本: 16开
纸张: 胶版纸
字数: 259.000千字
  • 告诉你一个不太光彩的秘密:在大多数数据科学项目中,有一半的时间都花在清理和准备数据上了。但还有更好的方法:针对表格数据和关系数据库进行优化的 深度学习技术,无需密集的特性工程,就能提供洞察和分析。学习使用少量的数据过滤、验证和清洗,就能解锁深度学习性能的技能。
      《深度学习处理结构化数据实战》传授面向表格数据和关系数据库的强大数据分析技术。本书从多伦多公交系统的数据集出发,带你领略用深度学习处理表格化数据的简易性和便捷性,并教你解决在生产环境中部署模型和监控模型性能等关键问题。
      主要内容
      ●何时何地使用深度学习技术
      ●Keras深度学习模型的架构
      ●训练、部署以及维护模型
      ●量化评估性能 Mark Ryan 是加拿大多伦多Intact Insurance(加拿大的房产、汽车和商业保险公司,隶属于加拿大Intact Financial Corporation)的数据科学经理。Mark 热衷于宣扬机器学习的好处,常组织机器学习训练营,使参与者能够亲身体验机器学习的世界。他潜心于深度学习,努力解锁深度学习在结构化表格数据处理上的潜力,此外,他还对聊天机器人和自动驾驶汽车的潜力深感兴趣。Mark 拥有加拿大滑铁卢大学的数学学士学位和多伦多大学的计算机科学硕士学位。 第1 章 为何要使用结构化数据进行深度学习   1

    1.1 深度学习概述  ·2

    1.2 深度学习的优缺点 7

    1.3 深度学习软件栈概述    10

    1.4 结构化数据与非结构化数据   12

    1.5 反对使用结构化数据进行深度学习的相关意见   15

    1.6 为何要研究基于结构化数据的深度学习问题?    16

    1.7 本书附带的代码概述    18

    1.8 你应该知道的内容    19

    1.9 本章小结  20

    第2 章 示例问题和Pandas数据帧简介 23

    2.1 深度学习开发环境选项    24

    2.2 探索Pandas 的代码    27

    2.3 Python 中的Pandas数据帧   28

    2.4 将CSV 文件提取到Pandas 数据帧中  31

    2.5 使用Pandas 来完成SQL 操作  32

    2.6 主示例:预测有轨电车的延误情况  35

    2.7 为何真实世界的数据集对于掌握深度学习至关重要  38

    2.8 输入数据集的格式和范围   39

    2.9 目的地:端到端的解决方案  41

    2.10 有关解决方案代码的更多细节  44

    2.11 开发环境:普通环境与深度学习专用环境   47

    2.12 深入研究反对深度学习的意见   48

    2.13 深度学习是如何变得更易于使用的  52

    2.14 训练深度学习模型初试   53

    2.15 本章小结  56

    第3 章 准备数据1:探索及清理数据   57

    3.1 探索及清理数据的代码    58

    3.2 在Python 中使用配置文件    58

    3.3 将XLS 文件提取到Pandas 数据帧中  61

    3.4 使用pickle 将Pandas数据帧从一个会话保存到另一个会话中  67

    3.5 探索数据  69

    3.6 将数据分为连续型、分类型以及文本型  74

    3.7 清理数据集中存在的问题:数据丢失、错误以及猜测    76

    3.8 确定深度学习需要多少数据  82

    3.9 本章小结  83

    第4 章 准备数据2:转换数据   ·85

    4.1 准备及转换数据的代码    86

    4.2 处理不正确的数值:路线    86

    4.3 为何只能用单个替代值来换掉所有错误的值?    89

    4.4 处理不正确的值:车辆    90

    4.5 处理不一致的值:位置    92

    4.6 去向远方:位置  94

    4.7 处理类型不匹配问题    98

    4.8 处理依然包含错误数据的行  99

    4.9 创建派生列  ·100

    4.10 准备非数值型数据来训练深度学习模型  101

    4.11 端到端解决方案概述  105

    4.12 本章小结 108

    第5 章 准备并构建模型  111

    5.1 数据泄露和数据特征是训练模型的公平博弈 112

    5.2 使用领域专业知识和小得分测试来防止数据泄露 113

    5.3 防止有轨电车延误预测中的数据泄露问题   114

    5.4 探索Keras 和建立模型的代码  ·117

    5.5 推导用于训练模型的数据帧  118

    5.6 将数据帧转换为Keras 模型期望的格式   122

    5.7 Keras 和TensorFlow

    简史   123

    5.8 从TensorFlow 1.x 迁移到TensorFlow 2  125

    5.9 TensorFlow 与PyTorch  126

    5.10 Keras 中的深度学习模型架构   127

    5.11 数据结构是如何定义Keras 模型的  132

    5.12 嵌入的力量  135

    5.13 基于数据结构自动构建Keras 模型的代码  138

    5.14 探索模型 141

    5.15 模型参数 148

    5.16 本章小结 149

    第6 章 模型训练与实验 151

    6.1 训练深度学习模型的代码   152

    6.2 审核训练深度学习模型的过程  ·152

    6.3 回顾有轨电车延误预测模型的总体目标   156

    6.4 选择训练、验证以及测试数据集  ·159

    6.5 初始训练 160

    6.6 评估模型的性能 163

    6.7 Keras 回调:从训练中获得收益  167

    6.8 从多次训练中获得相同的结果  ·175

    6.9 评估捷径 176

    6.10 显式保存已训练的模型  178

    6.11 运行一系列训练实验  179

    6.12 本章小结 186

    第7 章 对已训练的模型进行更多实验  187

    7.1 使用模型进行更多实验的代码  ·188

    7.2 验证删除不良值是否可改善模型  ·188

    7.3 验证嵌入列是否可提升模型的性能 190

    7.4 深度学习模型与XGBoost ·191

    7.5 改进深度学习模型可能的后继步骤  198

    7.6 本章小结 199

    第8 章 模型部署  201

    8.1 模型部署概述  202

    8.2 既然部署工作很重要,那为何又如此艰难?   204

    8.3 回顾一次性评分 204

    8.4 Web 部署的用户体验   206

    8.5 通过Web 部署来部署模型的步骤 207

    8.6 Web 部署的幕后知识   211

    8.7 使用Facebook Messenger 部署的用户体验 214

    8.8 使用FacebookMessenger 部署的幕后知识 217

    8.9 关于Rasa 的更多

    背景知识 218

    8.10 使用Rasa 在Facebook Messenger 中部署模型的步骤  221

    8.11 pipeline 简介  225

    8.12 在模型训练阶段定义pipeline   229

    8.13 在评分阶段应用pipeline ·232

    8.14 部署后维护模型  234

    8.15 本章小结 237

    第9 章 建议的后继步骤 239

    9.1 回顾本书目前已述内容   240

    9.2 有轨电车延误预测项目的后继工作 241

    9.3 将详细的位置信息添加到有轨电车延迟预测项目中 242

    9.4 使用天气数据来训练深度学习模型  246

    9.5 在有轨电车延误预测项目中增加季节或者一天中的时间

    数据   252

    9.6 归因:删除包含不良值的记录的替代方法   253

    9.7 发布有轨电车延误预测模型的Web部署   254

    9.8 使有轨电车延误预测模型适用于新的数据集  256

    9.9 准备数据集并训练模型   259

    9.10 通过Web 部署来部署模型   261

    9.11 使用FacebookMessenger 部署模型  263

    9.12 使本书中的方法适用于不同的数据集 ·266

    9.13 其他的学习资源  272

    9.14 本章小结 274

    附录 使用Google 协作实验室(GoogleColaboratory)  ·275

    A.1 Colab 简介  ·275

    A.2 使Google 云硬盘适用于Colab会话   277

    A.3 在Colab 中使用repo并运行notebook  279

    A.4 Colab 和Paperspace的优劣  282
  • 内容简介:
    告诉你一个不太光彩的秘密:在大多数数据科学项目中,有一半的时间都花在清理和准备数据上了。但还有更好的方法:针对表格数据和关系数据库进行优化的 深度学习技术,无需密集的特性工程,就能提供洞察和分析。学习使用少量的数据过滤、验证和清洗,就能解锁深度学习性能的技能。
      《深度学习处理结构化数据实战》传授面向表格数据和关系数据库的强大数据分析技术。本书从多伦多公交系统的数据集出发,带你领略用深度学习处理表格化数据的简易性和便捷性,并教你解决在生产环境中部署模型和监控模型性能等关键问题。
      主要内容
      ●何时何地使用深度学习技术
      ●Keras深度学习模型的架构
      ●训练、部署以及维护模型
      ●量化评估性能
  • 作者简介:
    Mark Ryan 是加拿大多伦多Intact Insurance(加拿大的房产、汽车和商业保险公司,隶属于加拿大Intact Financial Corporation)的数据科学经理。Mark 热衷于宣扬机器学习的好处,常组织机器学习训练营,使参与者能够亲身体验机器学习的世界。他潜心于深度学习,努力解锁深度学习在结构化表格数据处理上的潜力,此外,他还对聊天机器人和自动驾驶汽车的潜力深感兴趣。Mark 拥有加拿大滑铁卢大学的数学学士学位和多伦多大学的计算机科学硕士学位。
  • 目录:
    第1 章 为何要使用结构化数据进行深度学习   1

    1.1 深度学习概述  ·2

    1.2 深度学习的优缺点 7

    1.3 深度学习软件栈概述    10

    1.4 结构化数据与非结构化数据   12

    1.5 反对使用结构化数据进行深度学习的相关意见   15

    1.6 为何要研究基于结构化数据的深度学习问题?    16

    1.7 本书附带的代码概述    18

    1.8 你应该知道的内容    19

    1.9 本章小结  20

    第2 章 示例问题和Pandas数据帧简介 23

    2.1 深度学习开发环境选项    24

    2.2 探索Pandas 的代码    27

    2.3 Python 中的Pandas数据帧   28

    2.4 将CSV 文件提取到Pandas 数据帧中  31

    2.5 使用Pandas 来完成SQL 操作  32

    2.6 主示例:预测有轨电车的延误情况  35

    2.7 为何真实世界的数据集对于掌握深度学习至关重要  38

    2.8 输入数据集的格式和范围   39

    2.9 目的地:端到端的解决方案  41

    2.10 有关解决方案代码的更多细节  44

    2.11 开发环境:普通环境与深度学习专用环境   47

    2.12 深入研究反对深度学习的意见   48

    2.13 深度学习是如何变得更易于使用的  52

    2.14 训练深度学习模型初试   53

    2.15 本章小结  56

    第3 章 准备数据1:探索及清理数据   57

    3.1 探索及清理数据的代码    58

    3.2 在Python 中使用配置文件    58

    3.3 将XLS 文件提取到Pandas 数据帧中  61

    3.4 使用pickle 将Pandas数据帧从一个会话保存到另一个会话中  67

    3.5 探索数据  69

    3.6 将数据分为连续型、分类型以及文本型  74

    3.7 清理数据集中存在的问题:数据丢失、错误以及猜测    76

    3.8 确定深度学习需要多少数据  82

    3.9 本章小结  83

    第4 章 准备数据2:转换数据   ·85

    4.1 准备及转换数据的代码    86

    4.2 处理不正确的数值:路线    86

    4.3 为何只能用单个替代值来换掉所有错误的值?    89

    4.4 处理不正确的值:车辆    90

    4.5 处理不一致的值:位置    92

    4.6 去向远方:位置  94

    4.7 处理类型不匹配问题    98

    4.8 处理依然包含错误数据的行  99

    4.9 创建派生列  ·100

    4.10 准备非数值型数据来训练深度学习模型  101

    4.11 端到端解决方案概述  105

    4.12 本章小结 108

    第5 章 准备并构建模型  111

    5.1 数据泄露和数据特征是训练模型的公平博弈 112

    5.2 使用领域专业知识和小得分测试来防止数据泄露 113

    5.3 防止有轨电车延误预测中的数据泄露问题   114

    5.4 探索Keras 和建立模型的代码  ·117

    5.5 推导用于训练模型的数据帧  118

    5.6 将数据帧转换为Keras 模型期望的格式   122

    5.7 Keras 和TensorFlow

    简史   123

    5.8 从TensorFlow 1.x 迁移到TensorFlow 2  125

    5.9 TensorFlow 与PyTorch  126

    5.10 Keras 中的深度学习模型架构   127

    5.11 数据结构是如何定义Keras 模型的  132

    5.12 嵌入的力量  135

    5.13 基于数据结构自动构建Keras 模型的代码  138

    5.14 探索模型 141

    5.15 模型参数 148

    5.16 本章小结 149

    第6 章 模型训练与实验 151

    6.1 训练深度学习模型的代码   152

    6.2 审核训练深度学习模型的过程  ·152

    6.3 回顾有轨电车延误预测模型的总体目标   156

    6.4 选择训练、验证以及测试数据集  ·159

    6.5 初始训练 160

    6.6 评估模型的性能 163

    6.7 Keras 回调:从训练中获得收益  167

    6.8 从多次训练中获得相同的结果  ·175

    6.9 评估捷径 176

    6.10 显式保存已训练的模型  178

    6.11 运行一系列训练实验  179

    6.12 本章小结 186

    第7 章 对已训练的模型进行更多实验  187

    7.1 使用模型进行更多实验的代码  ·188

    7.2 验证删除不良值是否可改善模型  ·188

    7.3 验证嵌入列是否可提升模型的性能 190

    7.4 深度学习模型与XGBoost ·191

    7.5 改进深度学习模型可能的后继步骤  198

    7.6 本章小结 199

    第8 章 模型部署  201

    8.1 模型部署概述  202

    8.2 既然部署工作很重要,那为何又如此艰难?   204

    8.3 回顾一次性评分 204

    8.4 Web 部署的用户体验   206

    8.5 通过Web 部署来部署模型的步骤 207

    8.6 Web 部署的幕后知识   211

    8.7 使用Facebook Messenger 部署的用户体验 214

    8.8 使用FacebookMessenger 部署的幕后知识 217

    8.9 关于Rasa 的更多

    背景知识 218

    8.10 使用Rasa 在Facebook Messenger 中部署模型的步骤  221

    8.11 pipeline 简介  225

    8.12 在模型训练阶段定义pipeline   229

    8.13 在评分阶段应用pipeline ·232

    8.14 部署后维护模型  234

    8.15 本章小结 237

    第9 章 建议的后继步骤 239

    9.1 回顾本书目前已述内容   240

    9.2 有轨电车延误预测项目的后继工作 241

    9.3 将详细的位置信息添加到有轨电车延迟预测项目中 242

    9.4 使用天气数据来训练深度学习模型  246

    9.5 在有轨电车延误预测项目中增加季节或者一天中的时间

    数据   252

    9.6 归因:删除包含不良值的记录的替代方法   253

    9.7 发布有轨电车延误预测模型的Web部署   254

    9.8 使有轨电车延误预测模型适用于新的数据集  256

    9.9 准备数据集并训练模型   259

    9.10 通过Web 部署来部署模型   261

    9.11 使用FacebookMessenger 部署模型  263

    9.12 使本书中的方法适用于不同的数据集 ·266

    9.13 其他的学习资源  272

    9.14 本章小结 274

    附录 使用Google 协作实验室(GoogleColaboratory)  ·275

    A.1 Colab 简介  ·275

    A.2 使Google 云硬盘适用于Colab会话   277

    A.3 在Colab 中使用repo并运行notebook  279

    A.4 Colab 和Paperspace的优劣  282
查看详情
目前没有书店销售此书
相关图书 / 更多
深度学习处理结构化数据实战
深度域叠前逆时偏移成像技术及应用
李博、段心标 著
深度学习处理结构化数据实战
深度学习神经网络:设计与案例研究
[美]丹尼尔·格罗彼(Daniel Graupe)
深度学习处理结构化数据实战
深度护肤
高濑聪子
深度学习处理结构化数据实战
深度学习的技术
杨大辉 著
深度学习处理结构化数据实战
深度对话鲁奖作家
舒晋瑜 著
深度学习处理结构化数据实战
深度数字阅读推广研究
茆意宏;马坤坤;彭爱东
深度学习处理结构化数据实战
深度学习视频理解(博文视点出品)
张皓 著
深度学习处理结构化数据实战
深度思考
刘蔚 著
深度学习处理结构化数据实战
深度学习的计算方法:理论、实践与应用
[新加坡]Wei Qi Yan(闫伟齐
深度学习处理结构化数据实战
深度学习初学者指南
[智利]巴勃罗·里瓦斯(Pablo Rivas)
深度学习处理结构化数据实战
深度共情力:用天生的能力理解和感知他人,并最终发现自己
一沙
深度学习处理结构化数据实战
深度学习——原理、模型与实践
邓建华
您可能感兴趣 / 更多
深度学习处理结构化数据实战
新民说·动物社群:政治性的动物权利论
[加拿大]休·唐纳森 威尔·金里卡
深度学习处理结构化数据实战
以大制胜(说服心理学让你更了解情绪说服术)
[加拿大]斯科特·亚当斯 著;闾佳 译;湛庐文化 出品
深度学习处理结构化数据实战
越问越聪明:让孩子思维升级的科普书 2(科学大咖英格拉姆博士的“探究式科普”杰作来了!)
[加拿大]杰·英格拉姆 著;薛玮 译;青豆书坊 出品
深度学习处理结构化数据实战
权衡:批判性思维的探究与应用(修订版)(明德经典人文课)
[加拿大]莎伦·白琳(Sharon Bailin)马克·巴特斯比(Mark Batterssby)
深度学习处理结构化数据实战
怎么办?解决儿童成长的身心问题绘本
[加拿大]珍妮弗·摩尔-马丽诺斯
深度学习处理结构化数据实战
对抗焦虑,接纳自己
[加拿大]莎伦·贝格利 著;湛庐文化 出品
深度学习处理结构化数据实战
沙迪的鸭子(用阅读帮助孩子建立积极健康的心态。一个社恐孩子的逆袭之路,看他如何突破自我,向光而行。)
[加拿大]安娜·汉弗莱 著;王紫薇 译;白马时光 出品
深度学习处理结构化数据实战
半导体器件中的辐射效应
[加拿大]Krzysztof Iniewski(克日什托夫·印纽斯基
深度学习处理结构化数据实战
智能化的自适应系统:人和人工智能交互共栖的优化设计
[加拿大]Ming;Hou;[加拿大]Simon;Banbury
深度学习处理结构化数据实战
威士忌生产工艺与营销策略(第2版)
[加拿大]Inge Russell (英)Graham Stewart 主编
深度学习处理结构化数据实战
越问越聪明:让孩子思维升级的科普书(科学大咖英格拉姆博士的“探究式科普”杰作来了!)
[加拿大]杰.英格拉姆 著;杜冰 译;青豆书坊 出品
深度学习处理结构化数据实战
非线性波数学物理学入门(英文)
[加拿大]藤本实(Minoru;Fujimoto