工业大数据分析算法实战

工业大数据分析算法实战
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2022-09
版次: 1
ISBN: 9787111709619
定价: 158.00
装帧: 其他
开本: 16开
纸张: 胶版纸
页数: 480页
字数: 685千字
4人买过
  • 《工业大数据分析算法实践》以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制,使具有工科背景读者建立起数据思维,灵活利用数据分析算法进行实际问题的建模,并实现分析项目高效迭代与落地。具体主题覆盖了工业大数据分析工程思维和软件栈,工业数据的数据探索,预处理方法和常用机器学习算法,故障诊断、质量优化、流程优化的分析算法,专家规则驱动方法,以及工业数据分析工程等内容。
      《工业大数据分析算法实践》分10章,可划分为四个部分。第一部分(第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线。第2~5章是第二部分,侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和*优化等其他算法。第三部分包括第6~8章,讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路。第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。
      《工业大数据分析算法实践》适合工业大数据分析从业者、工业企业研发技术人员、工业互联网企业数据分析师阅读,也可作为上述人员的培训教材和相关专业师生的参考书。 田春华

    博士,北京工业大数据创新中心首席数据科学家,清华大学工业大数据研究中心,首席数据科学家;曾任IBM中国研究院研究经理,IEEE、INFORMS、ACM等学术组织及国际学术会议分会主席、执行委员、国际学术期刊审稿人。长期负责数据挖掘算法研究和产品工作,在高端装备制造、石油石化、新能源、航空与港口等行业,帮助几十家国内外领先企业成功实施资产管理、运营优化、营销洞察等数据分析项目。参与了多个工业大数据相关标准的制定工作、白皮书的编写工作、竞赛支持工作。发表论文近百篇,拥有40余项国际国内发明专利授权。 丛书序一

    丛书序二

    前言

    第1章 工业大数据分析概览 1 

    1.1 工业大数据分析的范畴与特点 1 

    1.1.1 数据分析的范畴 1 

    1.1.2 典型分析主题 2 

    1.1.3 工业数据分析的特点 4 

    1.1.4 数据分析的典型手段 5 

    1.2.1 CRISP-DM简介 9 

    1.2.2 分析课题的执行路径 10 

    1.3.1 脚本语言软件 12 

    1.3.2 图形化桌面软件 13 

    1.3.3 云端分析软件 14 

    1.4.1 分析算法理解的维度与路径 15 

    1.4.2 必读图书 16 

    1.4.3 分析算法背后的朴素思想 18 

    1.4.4 工程化思维 20 

    2.1 数据操作基础 23 

    2.1.1 数据框的基本操作 23 

    2.1.2 数据可视化 24 

    2.2.1 cumsum等primitive函数的利用:避免循环 25 

    2.2.2 带时间戳的数据框合并 26 

    2.2.3 时序数据可视化:多个子图共用一个x轴 29 

    2.2.4 时序数据可视化:NA用来间隔显示时序 31 

    2.2.5 参数区间的对比显示(在概率密度图上) 31 

    2.2.6 获取R文件的所在路径 32 

    2.2.7 分段线性回归如何通过lm()实现 33 

    2.3.1 引言 33 

    2.3.2 R语言EDA包 34 

    2.3.3 其他工具包 36 

    2.3.4 小结 37 

    2.4.1 数据的业务化 38 

    2.4.2 业务的数据化 41 

    2.4.3 机理演绎法 45 

    2.4.4 细致求实的基本素养 48 

    2.4.5 小结 50 

    2.5.1 基于数据类型的特征提取 51 

    2.5.2 基于关联关系的特征自动生成 54 

    2.5.3 基于语法树的变量间组合特征生成 55 

    2.6.1 特征选择的框架 56 

    2.6.2 搜索策略 57 

    2.6.3 子集评价 59 

    2.6.4 小结 65 

    3.1 统计分析 67 

    3.1.1 概率分布 69 

    3.1.2 参数估计 69 

    3.1.3 假设检验 72 

    3.2.2 基于核函数的非参数方法 73 

    3.2.3 单概率分布的参数化拟合 76 

    3.2.4 混合概率分布估计 79 

    3.2.5 小结 81 

    3.3.1 引言 82 

    3.3.2 基础线性回归模型———OLS模型 82 

    3.3.3 OLS模型检验 85 

    3.3.4 鲁棒线性回归 91 

    3.3.5 结构复杂度惩罚(正则化) 94 

    3.3.6 扩展 94 

    3.4.1 引言 96 

    3.4.2 前向计算过程 98 

    3.4.3 后剪枝过程 99 

    3.4.4 变量重要性评价 99 

    3.4.5 MARS与其他算法的关系 100 

    3.5.1 ANN逼近能力的直观理解 101 

    3.5.2 极限学习机 106 

    3.6.1 决策树的概念 111 

    3.6.2 决策树构建过程 112 

    3.6.3 常用决策树算法 113 

    3.7.1 引言 117 

    3.7.2 epsilon-SVR算法 118 

    3.7.3 nu-SVR算法 122 

    3.7.4 不同SVM算法包的差异 123 

    3.7.5 扩展 124 

    3.8.1 引言 124 

    3.8.2 工作原理 125 

    3.8.3 示例 126 

    3.8.4 讨论 128 

    3.9.1 引言 129 

    3.9.2 朴素贝叶斯 130 

    3.9.3 贝叶斯网络 131 

    3.9.4 一般图模型 134 

    3.9.5 讨论与扩展阅读 140 

    3.10.1 引言 141 

    3.10.2 Bagging方法 142 

    3.10.3 Boosting方法 143 

    3.10.4 Stacking方法 149 

    3.11.1 引言 157 

    3.11.2 评价指标 157 

    3.11.3 评价方法 163 

    3.11.4 特征重要度 165 

    3.12.1 引言 167 

    3.12.2 基于距离的聚类:K-means、PAM 167 

    3.12.3 基于层次的聚类:Hclust 169 

    3.12.4 基于密度的聚类:DBSCAN 171 

    3.12.5 基于分布的聚类:GMM 173 

    3.12.6 聚类结果的评价 173 

    3.13.1 引言 176 

    3.13.2 关联规则概念与度量指标 176 

    3.13.3 关联规则实现过程 176 

    3.13.4 关联规则算法 177 

    3.13.5 关联规则可视化 180 

    3.13.6 关联规则评价 182 

    3.14.1 引言 183 

    3.14.2 深度学习算法分类 183 

    3.14.3 深度学习框架 189 

    3.14.4 常见疑惑 194 

    3.14.5 深度学习算法的加速 196 

    3.15.1 计算负载模式 196 

    3.15.2 并行化计算 199 

    3.15.3 新计算范式 200 

    4.1 时序算法简介 210 

    4.2.1 傅里叶变换的直观理解 212 

    4.2.2 时频分析 216 

    4.2.3 时序变换 223 

    4.2.4 压缩感知 230 

    4.3.1 STL 234 

    4.3.2 奇异谱分析 238 

    4.3.3 EMD及扩展方法 245 

    4.4.1 Changepoint 250 

    4.4.2 TreeSplit 253 

    4.4.3 Autoplait 254 

    4.4.4 应用示例 255 

    4.6.1 数值型频繁模式 264 

    4.6.2 符号型频繁模式 266 

    4.7.1 基于度
  • 内容简介:
    《工业大数据分析算法实践》以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制,使具有工科背景读者建立起数据思维,灵活利用数据分析算法进行实际问题的建模,并实现分析项目高效迭代与落地。具体主题覆盖了工业大数据分析工程思维和软件栈,工业数据的数据探索,预处理方法和常用机器学习算法,故障诊断、质量优化、流程优化的分析算法,专家规则驱动方法,以及工业数据分析工程等内容。
      《工业大数据分析算法实践》分10章,可划分为四个部分。第一部分(第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线。第2~5章是第二部分,侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和*优化等其他算法。第三部分包括第6~8章,讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路。第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。
      《工业大数据分析算法实践》适合工业大数据分析从业者、工业企业研发技术人员、工业互联网企业数据分析师阅读,也可作为上述人员的培训教材和相关专业师生的参考书。
  • 作者简介:
    田春华

    博士,北京工业大数据创新中心首席数据科学家,清华大学工业大数据研究中心,首席数据科学家;曾任IBM中国研究院研究经理,IEEE、INFORMS、ACM等学术组织及国际学术会议分会主席、执行委员、国际学术期刊审稿人。长期负责数据挖掘算法研究和产品工作,在高端装备制造、石油石化、新能源、航空与港口等行业,帮助几十家国内外领先企业成功实施资产管理、运营优化、营销洞察等数据分析项目。参与了多个工业大数据相关标准的制定工作、白皮书的编写工作、竞赛支持工作。发表论文近百篇,拥有40余项国际国内发明专利授权。
  • 目录:
    丛书序一

    丛书序二

    前言

    第1章 工业大数据分析概览 1 

    1.1 工业大数据分析的范畴与特点 1 

    1.1.1 数据分析的范畴 1 

    1.1.2 典型分析主题 2 

    1.1.3 工业数据分析的特点 4 

    1.1.4 数据分析的典型手段 5 

    1.2.1 CRISP-DM简介 9 

    1.2.2 分析课题的执行路径 10 

    1.3.1 脚本语言软件 12 

    1.3.2 图形化桌面软件 13 

    1.3.3 云端分析软件 14 

    1.4.1 分析算法理解的维度与路径 15 

    1.4.2 必读图书 16 

    1.4.3 分析算法背后的朴素思想 18 

    1.4.4 工程化思维 20 

    2.1 数据操作基础 23 

    2.1.1 数据框的基本操作 23 

    2.1.2 数据可视化 24 

    2.2.1 cumsum等primitive函数的利用:避免循环 25 

    2.2.2 带时间戳的数据框合并 26 

    2.2.3 时序数据可视化:多个子图共用一个x轴 29 

    2.2.4 时序数据可视化:NA用来间隔显示时序 31 

    2.2.5 参数区间的对比显示(在概率密度图上) 31 

    2.2.6 获取R文件的所在路径 32 

    2.2.7 分段线性回归如何通过lm()实现 33 

    2.3.1 引言 33 

    2.3.2 R语言EDA包 34 

    2.3.3 其他工具包 36 

    2.3.4 小结 37 

    2.4.1 数据的业务化 38 

    2.4.2 业务的数据化 41 

    2.4.3 机理演绎法 45 

    2.4.4 细致求实的基本素养 48 

    2.4.5 小结 50 

    2.5.1 基于数据类型的特征提取 51 

    2.5.2 基于关联关系的特征自动生成 54 

    2.5.3 基于语法树的变量间组合特征生成 55 

    2.6.1 特征选择的框架 56 

    2.6.2 搜索策略 57 

    2.6.3 子集评价 59 

    2.6.4 小结 65 

    3.1 统计分析 67 

    3.1.1 概率分布 69 

    3.1.2 参数估计 69 

    3.1.3 假设检验 72 

    3.2.2 基于核函数的非参数方法 73 

    3.2.3 单概率分布的参数化拟合 76 

    3.2.4 混合概率分布估计 79 

    3.2.5 小结 81 

    3.3.1 引言 82 

    3.3.2 基础线性回归模型———OLS模型 82 

    3.3.3 OLS模型检验 85 

    3.3.4 鲁棒线性回归 91 

    3.3.5 结构复杂度惩罚(正则化) 94 

    3.3.6 扩展 94 

    3.4.1 引言 96 

    3.4.2 前向计算过程 98 

    3.4.3 后剪枝过程 99 

    3.4.4 变量重要性评价 99 

    3.4.5 MARS与其他算法的关系 100 

    3.5.1 ANN逼近能力的直观理解 101 

    3.5.2 极限学习机 106 

    3.6.1 决策树的概念 111 

    3.6.2 决策树构建过程 112 

    3.6.3 常用决策树算法 113 

    3.7.1 引言 117 

    3.7.2 epsilon-SVR算法 118 

    3.7.3 nu-SVR算法 122 

    3.7.4 不同SVM算法包的差异 123 

    3.7.5 扩展 124 

    3.8.1 引言 124 

    3.8.2 工作原理 125 

    3.8.3 示例 126 

    3.8.4 讨论 128 

    3.9.1 引言 129 

    3.9.2 朴素贝叶斯 130 

    3.9.3 贝叶斯网络 131 

    3.9.4 一般图模型 134 

    3.9.5 讨论与扩展阅读 140 

    3.10.1 引言 141 

    3.10.2 Bagging方法 142 

    3.10.3 Boosting方法 143 

    3.10.4 Stacking方法 149 

    3.11.1 引言 157 

    3.11.2 评价指标 157 

    3.11.3 评价方法 163 

    3.11.4 特征重要度 165 

    3.12.1 引言 167 

    3.12.2 基于距离的聚类:K-means、PAM 167 

    3.12.3 基于层次的聚类:Hclust 169 

    3.12.4 基于密度的聚类:DBSCAN 171 

    3.12.5 基于分布的聚类:GMM 173 

    3.12.6 聚类结果的评价 173 

    3.13.1 引言 176 

    3.13.2 关联规则概念与度量指标 176 

    3.13.3 关联规则实现过程 176 

    3.13.4 关联规则算法 177 

    3.13.5 关联规则可视化 180 

    3.13.6 关联规则评价 182 

    3.14.1 引言 183 

    3.14.2 深度学习算法分类 183 

    3.14.3 深度学习框架 189 

    3.14.4 常见疑惑 194 

    3.14.5 深度学习算法的加速 196 

    3.15.1 计算负载模式 196 

    3.15.2 并行化计算 199 

    3.15.3 新计算范式 200 

    4.1 时序算法简介 210 

    4.2.1 傅里叶变换的直观理解 212 

    4.2.2 时频分析 216 

    4.2.3 时序变换 223 

    4.2.4 压缩感知 230 

    4.3.1 STL 234 

    4.3.2 奇异谱分析 238 

    4.3.3 EMD及扩展方法 245 

    4.4.1 Changepoint 250 

    4.4.2 TreeSplit 253 

    4.4.3 Autoplait 254 

    4.4.4 应用示例 255 

    4.6.1 数值型频繁模式 264 

    4.6.2 符号型频繁模式 266 

    4.7.1 基于度
查看详情
相关图书 / 更多
您可能感兴趣 / 更多
工业大数据分析算法实战
工业大数据工程:系统、方法与实践
田春华
工业大数据分析算法实战
二维材料和异质结构(Two Dimensional Materials and Heterojunctions)
田春华;王金刚;全军
工业大数据分析算法实战
工业大数据分析实践
田春华
工业大数据分析算法实战
审计案例选编
田春华 编
工业大数据分析算法实战
辛亥革命在通州
田春华 主编;高志禄