SQL机器学习库MADlib技术解析

SQL机器学习库MADlib技术解析
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2019-01
版次: 1
ISBN: 9787302518945
定价: 79.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 342页
字数: 557千字
3人买过
  •   MADlib是一套SQL中的大数据机器学习库。通常SQL查询能发现数据1明显的模式和趋势,但要想获取数据中1为有用的信息,需要的则是一套牢固扎根于数学和应用数学的技能,这就是机器学习。如果将SQL的简单易用与MADlib机器学习的复杂算法结合起来,就能实现简单的机器学习功能。
      本书分为11章,从MADlib的基本概念、MADlib的架构、支持的模型类型与功能入手,详细解析MADlib各种模型的具体用法,包括数据类型、矩阵分解、数据转换、数据探索、主成分分析、回归、时间序列分析、分类、聚类、关联规则、图算法、模型评估等。每种模型将从背景知识、函数语法、应用示例三方面进行       说明。
      本书适合MADlib机器学习的初学者、想学习MADlib机器学习的DBA以及从事数据分析与挖掘的高级技术人员阅读,也适合高等院校与培训学校相关专业的师生教学参考。
      王雪迎 ,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作;先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位;著有图书《Hadoop构建数据仓库实践》和《HAWQ数据仓库与数据挖掘实战》。
    目  录
    第1章  MADlib基础    1
    1.1  基本概念    1
    1.1.1  MADlib是什么    1
    1.1.2  MADlib的设计思想    2
    1.1.3  MADlib的工作原理    3
    1.1.4  MADlib的执行流程    4
    1.1.5  MADlib架构    5
    1.2  MADlib的功能    6
    1.2.1  MADlib支持的模型类型    6
    1.2.2  MADlib的主要功能模块    7
    1.3  MADlib的安装与卸载    9
    1.3.1  确定安装平台    9
    1.3.2  下载MADlib二进制压缩包    10
    1.3.3  安装MADlib    10
    1.3.4  卸载MADlib    12
    1.4  小结    13
    第2章  数据类型    14
    2.1  向量    14
    2.1.1  MADlib中的向量操作函数    15
    2.1.2  稀疏向量    23
    2.2  矩阵    30
    2.2.1  矩阵定义    31
    2.2.2  MADlib中的矩阵表示    31
    2.2.3  MADlib中的矩阵运算函数    32
    2.3  小结    49
    第3章  数据转换    50
    3.1  邻近度    50
    3.1.1  MADlib的邻近度相关函数    50
    3.1.2  距离度量的中心化和标准化    57
    3.1.3  选取正确的邻近度度量    58
    3.2  矩阵分解    59
    3.2.1  低秩矩阵分解    59
    3.2.2  奇异值分解    70
    3.3  透视表    87
    3.4  分类变量编码    97
    3.5  小结    110
    第4章  数据探索    111
    4.1  描述性统计    111
    4.1.1  皮尔森相关    111
    4.1.2  汇总统计    117
    4.2  概率统计    125
    4.2.1  概率    125
    4.2.2  统计推论    133
    4.3  主成分分析    147
    4.3.1  背景知识    147
    4.3.2  MADlib的PCA相关函数    149
    4.3.3  MADlib的PCA应用示例    155
    4.4  小结    160
    第5章  回归    161
    5.1  线性回归    161
    5.1.1  背景知识    161
    5.1.2  MADlib的线性回归相关函数    164
    5.1.3  线性回归示例    166
    5.2  非线性回归    171
    5.2.1  背景知识    171
    5.2.2  MADlib的非线性回归相关
          函数    172
    5.2.3  非线性回归示例    175
    5.3  逻辑回归    179
    5.3.1  背景知识    179
    5.3.2  MADlib的逻辑回归相关函数    180
    5.3.3  逻辑回归示例    182
    5.4  多类回归    187
    5.4.1  背景知识    187
    5.4.2  MADlib的多类回归相关函数    190
    5.4.3  多类回归示例    192
    5.5  序数回归    196
    5.5.1  背景知识    196
    5.5.2  MADlib的序数回归相关函数    197
    5.5.3  序数回归示例    200
    5.6  弹性网络回归    202
    5.6.1  背景知识    202
    5.6.2  MADlib的弹性网络回归相关
          函数    204
    5.6.3  弹性网络回归示例    209
    5.7  小结    221
    第6章  时间序列分析    222
    6.1  背景知识    222
    6.1.1  时间序列分析方法    222
    6.1.2  ARIMA模型    223
    6.2  MADlib中ARIMA相关函数    225
    6.3  时间序列分析示例    228
    6.4  小结    232
    第7章  分类    233
    7.1  K近邻    233
    7.1.1  背景知识    233
    7.1.2  MADlib中K近邻函数    235
    7.1.3  K近邻示例    236
    7.2  朴素贝叶斯    240
    7.2.1  背景知识    240
    7.2.2  MADlib中朴素贝叶斯分类
          相关函数    242
    7.2.3  朴素贝叶斯分类示例    244
    7.3  支持向量机    249
    7.3.1  背景知识    249
    7.3.2  MADlib的支持向量机相关
          函数    252
    7.3.3  支持向量机示例    258
    7.4  决策树    264
    7.4.1  背景知识    264
    7.4.2  MADlib的决策树相关函数    267
    7.4.3  决策树示例    272
    7.5  随机森林    281
    7.5.1  背景知识    281
    7.5.2  MADlib的随机森林相关函数    282
    7.5.3  随机森林示例    287
    7.6  小结    293
    第8章  聚类    294
    8.1  背景知识    294
    8.1.1  聚类的概念    294
    8.1.2  k-means方法    295
    8.2  MADlib的k-means相关函数    297
    8.2.1  训练函数    298
    8.2.2  簇分配函数    300
    8.2.3  轮廓系数函数    301
    8.3  k-means示例    301
    8.4  小结    307
    第9章  关联规则    308
    9.1  背景知识    308
    9.1.1  基本概念    308
    9.1.2  Apriori算法    311
    9.2  MADlib的Apriori算法函数    312
    9.3  Apriori应用示例    313
    9.4  小结    319
    第10章  图算法    320
    10.1  背景知识    320
    10.1.1  基本概念    320
    10.1.2  常见图算法    321
    10.1.3  单源最短路径    323
    10.2  MADlib的单源最短路径相关函数    324
    10.3  单源最短路径示例    325
    10.4  小结    327
    第11章  模型评估    328
    11.1  交叉验证    328
    11.1.1  背景知识    328
    11.1.2  MADlib的交叉验证相关
           函数    331
    11.1.3  交叉验证示例    333
    11.2  预测度量    336
    11.3  小结    342
  • 内容简介:
      MADlib是一套SQL中的大数据机器学习库。通常SQL查询能发现数据1明显的模式和趋势,但要想获取数据中1为有用的信息,需要的则是一套牢固扎根于数学和应用数学的技能,这就是机器学习。如果将SQL的简单易用与MADlib机器学习的复杂算法结合起来,就能实现简单的机器学习功能。
      本书分为11章,从MADlib的基本概念、MADlib的架构、支持的模型类型与功能入手,详细解析MADlib各种模型的具体用法,包括数据类型、矩阵分解、数据转换、数据探索、主成分分析、回归、时间序列分析、分类、聚类、关联规则、图算法、模型评估等。每种模型将从背景知识、函数语法、应用示例三方面进行       说明。
      本书适合MADlib机器学习的初学者、想学习MADlib机器学习的DBA以及从事数据分析与挖掘的高级技术人员阅读,也适合高等院校与培训学校相关专业的师生教学参考。
  • 作者简介:
      王雪迎 ,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作;先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位;著有图书《Hadoop构建数据仓库实践》和《HAWQ数据仓库与数据挖掘实战》。
  • 目录:
    目  录
    第1章  MADlib基础    1
    1.1  基本概念    1
    1.1.1  MADlib是什么    1
    1.1.2  MADlib的设计思想    2
    1.1.3  MADlib的工作原理    3
    1.1.4  MADlib的执行流程    4
    1.1.5  MADlib架构    5
    1.2  MADlib的功能    6
    1.2.1  MADlib支持的模型类型    6
    1.2.2  MADlib的主要功能模块    7
    1.3  MADlib的安装与卸载    9
    1.3.1  确定安装平台    9
    1.3.2  下载MADlib二进制压缩包    10
    1.3.3  安装MADlib    10
    1.3.4  卸载MADlib    12
    1.4  小结    13
    第2章  数据类型    14
    2.1  向量    14
    2.1.1  MADlib中的向量操作函数    15
    2.1.2  稀疏向量    23
    2.2  矩阵    30
    2.2.1  矩阵定义    31
    2.2.2  MADlib中的矩阵表示    31
    2.2.3  MADlib中的矩阵运算函数    32
    2.3  小结    49
    第3章  数据转换    50
    3.1  邻近度    50
    3.1.1  MADlib的邻近度相关函数    50
    3.1.2  距离度量的中心化和标准化    57
    3.1.3  选取正确的邻近度度量    58
    3.2  矩阵分解    59
    3.2.1  低秩矩阵分解    59
    3.2.2  奇异值分解    70
    3.3  透视表    87
    3.4  分类变量编码    97
    3.5  小结    110
    第4章  数据探索    111
    4.1  描述性统计    111
    4.1.1  皮尔森相关    111
    4.1.2  汇总统计    117
    4.2  概率统计    125
    4.2.1  概率    125
    4.2.2  统计推论    133
    4.3  主成分分析    147
    4.3.1  背景知识    147
    4.3.2  MADlib的PCA相关函数    149
    4.3.3  MADlib的PCA应用示例    155
    4.4  小结    160
    第5章  回归    161
    5.1  线性回归    161
    5.1.1  背景知识    161
    5.1.2  MADlib的线性回归相关函数    164
    5.1.3  线性回归示例    166
    5.2  非线性回归    171
    5.2.1  背景知识    171
    5.2.2  MADlib的非线性回归相关
          函数    172
    5.2.3  非线性回归示例    175
    5.3  逻辑回归    179
    5.3.1  背景知识    179
    5.3.2  MADlib的逻辑回归相关函数    180
    5.3.3  逻辑回归示例    182
    5.4  多类回归    187
    5.4.1  背景知识    187
    5.4.2  MADlib的多类回归相关函数    190
    5.4.3  多类回归示例    192
    5.5  序数回归    196
    5.5.1  背景知识    196
    5.5.2  MADlib的序数回归相关函数    197
    5.5.3  序数回归示例    200
    5.6  弹性网络回归    202
    5.6.1  背景知识    202
    5.6.2  MADlib的弹性网络回归相关
          函数    204
    5.6.3  弹性网络回归示例    209
    5.7  小结    221
    第6章  时间序列分析    222
    6.1  背景知识    222
    6.1.1  时间序列分析方法    222
    6.1.2  ARIMA模型    223
    6.2  MADlib中ARIMA相关函数    225
    6.3  时间序列分析示例    228
    6.4  小结    232
    第7章  分类    233
    7.1  K近邻    233
    7.1.1  背景知识    233
    7.1.2  MADlib中K近邻函数    235
    7.1.3  K近邻示例    236
    7.2  朴素贝叶斯    240
    7.2.1  背景知识    240
    7.2.2  MADlib中朴素贝叶斯分类
          相关函数    242
    7.2.3  朴素贝叶斯分类示例    244
    7.3  支持向量机    249
    7.3.1  背景知识    249
    7.3.2  MADlib的支持向量机相关
          函数    252
    7.3.3  支持向量机示例    258
    7.4  决策树    264
    7.4.1  背景知识    264
    7.4.2  MADlib的决策树相关函数    267
    7.4.3  决策树示例    272
    7.5  随机森林    281
    7.5.1  背景知识    281
    7.5.2  MADlib的随机森林相关函数    282
    7.5.3  随机森林示例    287
    7.6  小结    293
    第8章  聚类    294
    8.1  背景知识    294
    8.1.1  聚类的概念    294
    8.1.2  k-means方法    295
    8.2  MADlib的k-means相关函数    297
    8.2.1  训练函数    298
    8.2.2  簇分配函数    300
    8.2.3  轮廓系数函数    301
    8.3  k-means示例    301
    8.4  小结    307
    第9章  关联规则    308
    9.1  背景知识    308
    9.1.1  基本概念    308
    9.1.2  Apriori算法    311
    9.2  MADlib的Apriori算法函数    312
    9.3  Apriori应用示例    313
    9.4  小结    319
    第10章  图算法    320
    10.1  背景知识    320
    10.1.1  基本概念    320
    10.1.2  常见图算法    321
    10.1.3  单源最短路径    323
    10.2  MADlib的单源最短路径相关函数    324
    10.3  单源最短路径示例    325
    10.4  小结    327
    第11章  模型评估    328
    11.1  交叉验证    328
    11.1.1  背景知识    328
    11.1.2  MADlib的交叉验证相关
           函数    331
    11.1.3  交叉验证示例    333
    11.2  预测度量    336
    11.3  小结    342
查看详情
相关图书 / 更多
SQL机器学习库MADlib技术解析
SQL从入门到进阶
陈红波 编著
SQL机器学习库MADlib技术解析
SQL Server数据库实用案例教程(第2版·微课视频版)
王雪梅 李海晨 主编;马亚丽 华进 蔡斌杰 副主编
SQL机器学习库MADlib技术解析
SQLServer2019数据库管理项目教程(活页式高等职业教育计算机专业活页式系列教材)
黄小花、黄侃、熊慧芳 编
SQL机器学习库MADlib技术解析
SQL面试宝典:图解数据库求职题(全彩)
猴子
SQL机器学习库MADlib技术解析
SQL Server数据库设计与应用(第2版)
张成叔
SQL机器学习库MADlib技术解析
SQL Server数据库应用入门(项目式+微课版)
李武韬 文瑛 吴超
SQL机器学习库MADlib技术解析
SQL Server实例教程(2019版)
刘志成
SQL机器学习库MADlib技术解析
SQL实践教程(第10版)
[美]马克·谢尔曼(Mark Shellman)哈桑·阿夫尤尼(Hassan A
SQL机器学习库MADlib技术解析
SQL Server 2014数据库原理与实训教程
吴小刚 主编;彭文惠
SQL机器学习库MADlib技术解析
SQL语言从入门到精通
明日科技
SQL机器学习库MADlib技术解析
SQL Server从入门到精通(第5版)
明日科技
SQL机器学习库MADlib技术解析
SQL数据分析
[美]凯西·谷村(Cathy Tanimura)
您可能感兴趣 / 更多