数据挖掘与机器学习 WEKA应用技术与实践(第二版)
出版时间:
2016-08
版次:
2
ISBN:
9787302444701
定价:
79.00
装帧:
平装
开本:
16开
纸张:
胶版纸
页数:
548页
字数:
832千字
正文语种:
简体中文
105人买过
-
本书借助代表当今数据挖掘和机器学习*高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全书共分9章,主要内容包括Weka介绍、探索者界面、知识流界面、实验者界面、命令行界面、Weka高级应用、Weka API、学习方案源代码分析和机器学习实战。 本书系统讲解Weka 3.7.13的操作、理论和应用,内容全面、实例丰富、可操作性强,做到理论与实践的统一。本书适合数据挖掘和机器学习相关人员作为技术参考书使用,也适合用作计算机专业高年级本科生和研究生的教材或教学参考用书。
袁梅宇,男,工学博士,硕士导师,现在昆明理工大学计算机系任教。为本科生和研究生主讲Java程序设计、JavaEE技术、数据库原理、人工智能、DotNet技术等核心课程,参加过863CIMSNet建设、中欧合作项目DRAGON和多项国家基金和省基金项目,第*作者公开发表论文十余篇,软件著作权(颁证)六项。
第1章 Weka介绍 1
1.1 Weka简介 2
1.1.1 Weka历史 3
1.1.2 Weka功能简介 3
1.2 基本概念 5
1.2.1 数据挖掘和机器学习 5
1.2.2 数据和数据集 5
1.2.3 ARFF格式 6
1.2.4 预处理 7
1.2.5 分类与回归 10
1.2.6 聚类分析 12
1.2.7 关联分析 12
1.3 Weka系统安装 13
1.3.1 系统要求 13
1.3.2 安装过程 14
1.3.3 Weka使用初步 16
1.3.4 系统运行注意事项 18
1.4 访问数据库 24
1.4.1 配置文件 25
1.4.2 数据库设置 26
1.4.3 常见问题及解决办法 27
1.5 示例数据集 28
1.5.1 天气问题 29
1.5.2 鸢尾花 30
1.5.3 CPU 31
1.5.4 玻璃数据集 32
1.5.5 美国国会投票记录 33
1.5.6 乳腺癌数据集 33
课后强化练习 34
第2章 探索者界面 35
2.1 图形用户界面 36
2.1.1 标签页简介 36
2.1.2 状态栏 37
2.1.3 图像输出 37
2.1.4 手把手教你用 37
2.2 预处理 40
2.2.1 加载数据 40
2.2.2 属性处理 43
2.2.3 过滤器 44
2.2.4 过滤器算法介绍 46
2.2.5 手把手教你用 52
2.3 分类 59
2.3.1 分类器选择 59
2.3.2 分类器训练 61
2.3.3 分类器输出 62
2.3.4 分类算法介绍 65
2.3.5 分类模型评估 79
2.3.6 手把手教你用 81
2.4 聚类 98
2.4.1 Cluster标签页的操作 98
2.4.2 聚类算法介绍 99
2.4.3 手把手教你用 101
2.5 关联 107
2.5.1 Associate标签页的操作 107
2.5.2 关联算法介绍 108
2.5.3 手把手教你用 111
2.6 选择属性 117
2.6.1 Select attributes标签页的
操作 118
2.6.2 选择属性算法介绍 119
2.6.3 手把手教你用 120
2.7 可视化 128
2.7.1 Visualize标签页 128
2.7.2 边界可视化工具 131
2.7.3 代价/收益分析可视化 133
2.7.4 手把手教你用 134
课后强化练习 140
第3章 知识流界面 143
3.1 知识流介绍 144
3.1.1 知识流特性 144
3.1.2 知识流界面布局 145
3.2 知识流组件 148
3.2.1 数据源 148
3.2.2 数据接收器 151
3.2.3 评估器 155
3.2.4 可视化器 156
3.2.5 其他工具 158
3.3 使用知识流组件 160
3.4 手把手教你用 162
课后强化练习 181
第4章 实验者界面 183
4.1 简介 184
4.2 标准实验 185
4.2.1 简单实验 185
4.2.2 高级实验 190
4.2.3 手把手教你用 198
4.3 远程实验 210
4.3.1 远程实验设置 210
4.3.2 手把手教你用 213
4.4 分析结果 221
4.4.1 获取实验结果 221
4.4.2 动作 221
4.4.3 配置测试 222
4.4.4 保存结果 225
4.4.5 手把手教你用 225
课后强化练习 229
第5章 命令行界面 231
5.1 命令行界面介绍 232
5.1.1 命令调用 233
5.1.2 命令自动完成 234
5.2 Weka结构 235
5.2.1 类实例和包 235
5.2.2 weka.core包 236
5.2.3 weka.classifiers包 237
5.2.4 其他包 238
5.3 命令行选项 238
5.3.1 常规选项 239
5.3.2 特定选项 241
5.4 过滤器和分类器选项 242
5.4.1 过滤器选项 242
5.4.2 分类器选项 245
5.4.3 手把手教你用 247
5.5 包管理器 252
5.5.1 命令行包管理器 252
5.5.2 运行安装的算法 254
课后强化练习 255
第6章 Weka高级应用 257
6.1 贝叶斯网络 258
6.1.1 简介 258
6.1.2 贝叶斯网络编辑器 261
6.1.3 在探索者界面中使用贝叶斯
网络 269
6.1.4 结构学习 270
6.1.5 分布学习 272
6.1.6 查看贝叶斯网络 273
6.1.7 手把手教你用 276
6.2 神经网络 286
6.2.1 GUI使用 286
6.2.2 手把手教你用 289
6.3 文本分类 293
6.3.1 文本分类示例 294
6.3.2 分类真实文本 298
6.3.3 手把手教你用 300
6.4 时间序列分析及预测 306
6.4.1 使用时间序列环境 306
6.4.2 手把手教你用 318
课后强化练习 326
第7章 Weka API 327
7.1 加载数据 328
7.1.1 从文件加载数据 328
7.1.2 从数据库加载数据 329
7.1.3 手把手教你用 330
7.2 保存数据 335
7.2.1 保存数据至文件 335
7.2.2 保存数据至数据库 335
7.2.3 手把手教你用 336
7.3 处理选项 339
7.3.1 选项处理方法 339
7.3.2 手把手教你用 340
7.4 内存数据集处理 341
7.4.1 在内存中创建数据集 341
7.4.2 打乱数据顺序 345
7.4.3 手把手教你用 345
7.5 过滤 349
7.5.1 批量过滤 350
7.5.2 即时过滤 351
7.5.3 手把手教你用 351
7.6 分类 355
7.6.1 分类器构建 355
7.6.2 分类器评估 356
7.6.3 实例分类 358
7.6.4 手把手教你用 359
7.7 聚类 370
7.7.1 聚类器构建 370
7.7.2 聚类器评估 371
7.7.3 实例聚类 373
7.7.4 手把手教你用 373
7.8 属性选择 379
7.8.1 使用元分类器 380
7.8.2 使用过滤器 380
7.8.3 使用底层API 381
7.8.4 手把手教你用 381
7.9 可视化 384
7.9.1 ROC曲线 385
7.9.2 图 385
7.9.3 手把手教你用 386
7.10 序列化 391
7.10.1 序列化基本方法 391
7.10.2 手把手教你用 392
7.11 文本分类综合示例 395
7.11.1 程序运行准备 395
7.11.2 源程序分析 396
7.11.3 运行说明 403
课后强化练习 404
第8章 学习方案源代码分析 405
8.1 NaiveBayes源代码分析 406
8.2 实现分类器的约定 427
课后强化练习 429
第9章 机器学习实战 431
9.1 数据挖掘过程概述 432
9.1.1 CRISP-DM过程 432
9.1.2 数据预处理 433
9.1.3 挖掘项目及工具概述 434
9.2 实战KDD Cup 1999 434
9.2.1 任务描述 435
9.2.2 数据集描述 436
9.2.3 挖掘详细过程 438
9.3 实战KDD Cup 2010 447
9.3.1 任务描述 447
9.3.2 数据集描述 447
9.3.3 挖掘详细过程 450
9.3.4 更接近实际的挖掘过程 459
课后强化练习 471
附录A 中英文术语对照 472
附录B Weka算法介绍 476
过滤器算法介绍 476
分类算法介绍 498
聚类算法介绍 526
关联算法介绍 530
选择属性算法介绍 532
参考文献 537
-
内容简介:
本书借助代表当今数据挖掘和机器学习*高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全书共分9章,主要内容包括Weka介绍、探索者界面、知识流界面、实验者界面、命令行界面、Weka高级应用、Weka API、学习方案源代码分析和机器学习实战。 本书系统讲解Weka 3.7.13的操作、理论和应用,内容全面、实例丰富、可操作性强,做到理论与实践的统一。本书适合数据挖掘和机器学习相关人员作为技术参考书使用,也适合用作计算机专业高年级本科生和研究生的教材或教学参考用书。
-
作者简介:
袁梅宇,男,工学博士,硕士导师,现在昆明理工大学计算机系任教。为本科生和研究生主讲Java程序设计、JavaEE技术、数据库原理、人工智能、DotNet技术等核心课程,参加过863CIMSNet建设、中欧合作项目DRAGON和多项国家基金和省基金项目,第*作者公开发表论文十余篇,软件著作权(颁证)六项。
-
目录:
第1章 Weka介绍 1
1.1 Weka简介 2
1.1.1 Weka历史 3
1.1.2 Weka功能简介 3
1.2 基本概念 5
1.2.1 数据挖掘和机器学习 5
1.2.2 数据和数据集 5
1.2.3 ARFF格式 6
1.2.4 预处理 7
1.2.5 分类与回归 10
1.2.6 聚类分析 12
1.2.7 关联分析 12
1.3 Weka系统安装 13
1.3.1 系统要求 13
1.3.2 安装过程 14
1.3.3 Weka使用初步 16
1.3.4 系统运行注意事项 18
1.4 访问数据库 24
1.4.1 配置文件 25
1.4.2 数据库设置 26
1.4.3 常见问题及解决办法 27
1.5 示例数据集 28
1.5.1 天气问题 29
1.5.2 鸢尾花 30
1.5.3 CPU 31
1.5.4 玻璃数据集 32
1.5.5 美国国会投票记录 33
1.5.6 乳腺癌数据集 33
课后强化练习 34
第2章 探索者界面 35
2.1 图形用户界面 36
2.1.1 标签页简介 36
2.1.2 状态栏 37
2.1.3 图像输出 37
2.1.4 手把手教你用 37
2.2 预处理 40
2.2.1 加载数据 40
2.2.2 属性处理 43
2.2.3 过滤器 44
2.2.4 过滤器算法介绍 46
2.2.5 手把手教你用 52
2.3 分类 59
2.3.1 分类器选择 59
2.3.2 分类器训练 61
2.3.3 分类器输出 62
2.3.4 分类算法介绍 65
2.3.5 分类模型评估 79
2.3.6 手把手教你用 81
2.4 聚类 98
2.4.1 Cluster标签页的操作 98
2.4.2 聚类算法介绍 99
2.4.3 手把手教你用 101
2.5 关联 107
2.5.1 Associate标签页的操作 107
2.5.2 关联算法介绍 108
2.5.3 手把手教你用 111
2.6 选择属性 117
2.6.1 Select attributes标签页的
操作 118
2.6.2 选择属性算法介绍 119
2.6.3 手把手教你用 120
2.7 可视化 128
2.7.1 Visualize标签页 128
2.7.2 边界可视化工具 131
2.7.3 代价/收益分析可视化 133
2.7.4 手把手教你用 134
课后强化练习 140
第3章 知识流界面 143
3.1 知识流介绍 144
3.1.1 知识流特性 144
3.1.2 知识流界面布局 145
3.2 知识流组件 148
3.2.1 数据源 148
3.2.2 数据接收器 151
3.2.3 评估器 155
3.2.4 可视化器 156
3.2.5 其他工具 158
3.3 使用知识流组件 160
3.4 手把手教你用 162
课后强化练习 181
第4章 实验者界面 183
4.1 简介 184
4.2 标准实验 185
4.2.1 简单实验 185
4.2.2 高级实验 190
4.2.3 手把手教你用 198
4.3 远程实验 210
4.3.1 远程实验设置 210
4.3.2 手把手教你用 213
4.4 分析结果 221
4.4.1 获取实验结果 221
4.4.2 动作 221
4.4.3 配置测试 222
4.4.4 保存结果 225
4.4.5 手把手教你用 225
课后强化练习 229
第5章 命令行界面 231
5.1 命令行界面介绍 232
5.1.1 命令调用 233
5.1.2 命令自动完成 234
5.2 Weka结构 235
5.2.1 类实例和包 235
5.2.2 weka.core包 236
5.2.3 weka.classifiers包 237
5.2.4 其他包 238
5.3 命令行选项 238
5.3.1 常规选项 239
5.3.2 特定选项 241
5.4 过滤器和分类器选项 242
5.4.1 过滤器选项 242
5.4.2 分类器选项 245
5.4.3 手把手教你用 247
5.5 包管理器 252
5.5.1 命令行包管理器 252
5.5.2 运行安装的算法 254
课后强化练习 255
第6章 Weka高级应用 257
6.1 贝叶斯网络 258
6.1.1 简介 258
6.1.2 贝叶斯网络编辑器 261
6.1.3 在探索者界面中使用贝叶斯
网络 269
6.1.4 结构学习 270
6.1.5 分布学习 272
6.1.6 查看贝叶斯网络 273
6.1.7 手把手教你用 276
6.2 神经网络 286
6.2.1 GUI使用 286
6.2.2 手把手教你用 289
6.3 文本分类 293
6.3.1 文本分类示例 294
6.3.2 分类真实文本 298
6.3.3 手把手教你用 300
6.4 时间序列分析及预测 306
6.4.1 使用时间序列环境 306
6.4.2 手把手教你用 318
课后强化练习 326
第7章 Weka API 327
7.1 加载数据 328
7.1.1 从文件加载数据 328
7.1.2 从数据库加载数据 329
7.1.3 手把手教你用 330
7.2 保存数据 335
7.2.1 保存数据至文件 335
7.2.2 保存数据至数据库 335
7.2.3 手把手教你用 336
7.3 处理选项 339
7.3.1 选项处理方法 339
7.3.2 手把手教你用 340
7.4 内存数据集处理 341
7.4.1 在内存中创建数据集 341
7.4.2 打乱数据顺序 345
7.4.3 手把手教你用 345
7.5 过滤 349
7.5.1 批量过滤 350
7.5.2 即时过滤 351
7.5.3 手把手教你用 351
7.6 分类 355
7.6.1 分类器构建 355
7.6.2 分类器评估 356
7.6.3 实例分类 358
7.6.4 手把手教你用 359
7.7 聚类 370
7.7.1 聚类器构建 370
7.7.2 聚类器评估 371
7.7.3 实例聚类 373
7.7.4 手把手教你用 373
7.8 属性选择 379
7.8.1 使用元分类器 380
7.8.2 使用过滤器 380
7.8.3 使用底层API 381
7.8.4 手把手教你用 381
7.9 可视化 384
7.9.1 ROC曲线 385
7.9.2 图 385
7.9.3 手把手教你用 386
7.10 序列化 391
7.10.1 序列化基本方法 391
7.10.2 手把手教你用 392
7.11 文本分类综合示例 395
7.11.1 程序运行准备 395
7.11.2 源程序分析 396
7.11.3 运行说明 403
课后强化练习 404
第8章 学习方案源代码分析 405
8.1 NaiveBayes源代码分析 406
8.2 实现分类器的约定 427
课后强化练习 429
第9章 机器学习实战 431
9.1 数据挖掘过程概述 432
9.1.1 CRISP-DM过程 432
9.1.2 数据预处理 433
9.1.3 挖掘项目及工具概述 434
9.2 实战KDD Cup 1999 434
9.2.1 任务描述 435
9.2.2 数据集描述 436
9.2.3 挖掘详细过程 438
9.3 实战KDD Cup 2010 447
9.3.1 任务描述 447
9.3.2 数据集描述 447
9.3.3 挖掘详细过程 450
9.3.4 更接近实际的挖掘过程 459
课后强化练习 471
附录A 中英文术语对照 472
附录B Weka算法介绍 476
过滤器算法介绍 476
分类算法介绍 498
聚类算法介绍 526
关联算法介绍 530
选择属性算法介绍 532
参考文献 537
查看详情
-
全新
广东省广州市
平均发货17小时
成功完成率94.35%
-
全新
广东省广州市
平均发货17小时
成功完成率96.05%
-
全新
广东省广州市
平均发货18小时
成功完成率95.8%
-
全新
广东省广州市
平均发货17小时
成功完成率94.17%
-
全新
北京市通州区
平均发货12小时
成功完成率77.27%
-
全新
山东省济宁市
平均发货44小时
成功完成率81.96%
-
全新
北京市朝阳区
平均发货10小时
成功完成率88.57%
-
九五品
天津市宝坻区
平均发货15小时
成功完成率88.99%
-
八五品
四川省成都市
平均发货10小时
成功完成率90.48%
-
全新
北京市朝阳区
平均发货23小时
成功完成率83.48%
-
2
全新
河北省保定市
平均发货17小时
成功完成率87.2%
-
九五品
四川省成都市
平均发货11小时
成功完成率93.27%
-
数据挖掘与机器学习
本店所售图书,保证正版新书,有个别图片和实书封面不一样,以实书封面为准,有需要确定的可以联系客服。我店不能开发票。当天下单第二天发货。
全新
四川省成都市
平均发货27小时
成功完成率79.89%
-
2
全新
河北省保定市
平均发货17小时
成功完成率87.2%
-
5
全新
北京市丰台区
平均发货27小时
成功完成率82.8%
-
九五品
北京市通州区
平均发货23小时
成功完成率80.7%
-
全新
河北省保定市
平均发货27小时
成功完成率79.79%
-
全新
江苏省无锡市
平均发货14小时
成功完成率90.04%
-
八五品
河南省鹤壁市
平均发货11小时
成功完成率94.96%
-
八五品
四川省成都市
平均发货11小时
成功完成率93.27%
-
九五品
天津市宝坻区
平均发货14小时
成功完成率88.51%
-
全新
四川省成都市
平均发货7小时
成功完成率96.51%
-
八五品
山东省枣庄市
平均发货9小时
成功完成率88.64%
-
八五品
山东省枣庄市
平均发货8小时
成功完成率92.85%
-
八五品
山东省济南市
平均发货8小时
成功完成率91.33%
-
14
八五品
重庆市沙坪坝区
平均发货8小时
成功完成率90.42%
-
八五品
重庆市沙坪坝区
平均发货8小时
成功完成率90.8%
-
全新
北京市房山区
平均发货7小时
成功完成率97.52%
-
2019-12 印刷
印次: 5
九品
北京市海淀区
平均发货6小时
成功完成率86.14%
-
八五品
河南省鹤壁市
平均发货10小时
成功完成率95.34%
-
全新
江苏省无锡市
平均发货9小时
成功完成率93.18%
-
全新
江苏省南京市
平均发货15小时
成功完成率82.32%
-
7
2017-11 印刷
印次: 3
八五品
安徽省蚌埠市
平均发货11小时
成功完成率97.59%
-
全新
北京市东城区
平均发货9小时
成功完成率95.84%
-
全新
天津市西青区
平均发货15小时
成功完成率92.48%
-
全新
江苏省南京市
平均发货10小时
成功完成率92.35%
-
全新
江苏省南京市
平均发货9小时
成功完成率91.33%
-
全新
河北省廊坊市
平均发货22小时
成功完成率82.92%
-
全新
北京市丰台区
平均发货10小时
成功完成率89.33%
-
八五品
湖北省武汉市
平均发货15小时
成功完成率93.77%
-
数据挖掘与机器学习
按标题名购买,批量下载图片有时不对应,多本图片为其中一本,有问题请联系客服。
全新
河北省保定市
平均发货25小时
成功完成率85.73%
-
全新
北京市东城区
平均发货25小时
成功完成率83.13%
-
14
八五品
浙江省杭州市
平均发货9小时
成功完成率93.7%
-
九品
河南省鹤壁市
平均发货11小时
成功完成率93.69%
-
九品
河南省鹤壁市
平均发货11小时
成功完成率93.69%
-
全新
天津市河东区
平均发货21小时
成功完成率91.04%
-
全新
江苏省无锡市
平均发货14小时
成功完成率90.5%
-
九五品
浙江省杭州市
平均发货9小时
成功完成率93.7%
-
八五品
广西南宁市
平均发货13小时
成功完成率80.63%
-
2
八五品
上海市奉贤区
平均发货8小时
成功完成率94.15%