精通数据科学算法

精通数据科学算法
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [英] (David Natingga) , , ,
2019-05
版次: 1
ISBN: 9787115498168
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 164页
14人买过
  • 数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。

    本书讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。

    本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。 Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。

    他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。 第 1 章 用k最近邻算法解决分类问题

    1.1 Mary对温度的感觉

    1.2 实现k最近邻算法

    1.3 意大利地区的示例——选择k值

    1.4 房屋所有权——数据转换

    1.5 文本分类——使用非欧几里德距离

    1.6 文本分类——更高维度的k-NN

    1.7 小结

    1.8 习题

    第 2 章 朴素贝叶斯

    2.1 医疗检查——贝叶斯定理的基本应用

    2.2 贝叶斯定理的证明及其扩展

    2.3 西洋棋游戏——独立事件

    2.4 朴素贝叶斯分类器的实现

    2.5 西洋棋游戏——相关事件

    2.6 性别分类——基于连续随机变量的贝叶斯定理

    2.7 小结

    2.8 习题

    第 3 章 决策树

    3.1 游泳偏好——用决策树表示数据

    3.2 信息论 044

    3.3 ID3算法——构造决策树 047

    3.4 用决策树进行分类 054

    3.5 小结 060

    3.6 习题 060

    第 4 章 随机森林 064

    4.1 随机森林算法概述 064

    4.2 游泳偏好——随机森林分析法 065

    4.3 随机森林算法的实现 071

    4.4 下棋实例 075

    4.5 购物分析——克服随机数据的不一致性以及

    度量置信水平 082

    4.6 小结 084

    4.7 习题 084

    第 5 章 k-means聚类 089

    5.1 家庭收入——聚类为k个簇 089

    5.2 性别分类——聚类分类 092

    5.3 k-means聚类算法的实现 095

    5.4 房产所有权示例——选择簇的数量 099

    5.5 小结 105

    5.6 习题 105

    第 6 章 回归分析 114

    6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114

    6.2 根据身高预测体重——基于实际数据的线性回归 117

    6.3 梯度下降算法及实现 118

    6.4 根据距离预测飞行时长 122

    6.5 弹道飞行分析——非线性模型 123

    6.6 小 结 125

    6.7 习 题 125

    第 7 章 时间序列分析 130

    7.1 商业利润——趋势分析 130

    7.2 电子商店的销售额——季节性分析 132

    7.3 小 结 140

    7.4 习 题 140

    附录 A 统计 145

    A.1 基本概念 145

    A.2 贝叶斯推理 146

    A.3 分 布 146

    A.4 交叉验证 147

    A.5 A/B 测 试 148

    附录 B R参考 149

    B.1 介 绍 149

    B.2 数据类型 150

    B.3 线性回归 152

    附录 C Python参考 154

    C.1 介 绍 154

    C.2 数据类型 155

    C.3 控 制 流 159

    附录 D 数据科学中的算法和方法术语 163
  • 内容简介:
    数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。

    本书讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。

    本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。
  • 作者简介:
    Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。

    他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。
  • 目录:
    第 1 章 用k最近邻算法解决分类问题

    1.1 Mary对温度的感觉

    1.2 实现k最近邻算法

    1.3 意大利地区的示例——选择k值

    1.4 房屋所有权——数据转换

    1.5 文本分类——使用非欧几里德距离

    1.6 文本分类——更高维度的k-NN

    1.7 小结

    1.8 习题

    第 2 章 朴素贝叶斯

    2.1 医疗检查——贝叶斯定理的基本应用

    2.2 贝叶斯定理的证明及其扩展

    2.3 西洋棋游戏——独立事件

    2.4 朴素贝叶斯分类器的实现

    2.5 西洋棋游戏——相关事件

    2.6 性别分类——基于连续随机变量的贝叶斯定理

    2.7 小结

    2.8 习题

    第 3 章 决策树

    3.1 游泳偏好——用决策树表示数据

    3.2 信息论 044

    3.3 ID3算法——构造决策树 047

    3.4 用决策树进行分类 054

    3.5 小结 060

    3.6 习题 060

    第 4 章 随机森林 064

    4.1 随机森林算法概述 064

    4.2 游泳偏好——随机森林分析法 065

    4.3 随机森林算法的实现 071

    4.4 下棋实例 075

    4.5 购物分析——克服随机数据的不一致性以及

    度量置信水平 082

    4.6 小结 084

    4.7 习题 084

    第 5 章 k-means聚类 089

    5.1 家庭收入——聚类为k个簇 089

    5.2 性别分类——聚类分类 092

    5.3 k-means聚类算法的实现 095

    5.4 房产所有权示例——选择簇的数量 099

    5.5 小结 105

    5.6 习题 105

    第 6 章 回归分析 114

    6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114

    6.2 根据身高预测体重——基于实际数据的线性回归 117

    6.3 梯度下降算法及实现 118

    6.4 根据距离预测飞行时长 122

    6.5 弹道飞行分析——非线性模型 123

    6.6 小 结 125

    6.7 习 题 125

    第 7 章 时间序列分析 130

    7.1 商业利润——趋势分析 130

    7.2 电子商店的销售额——季节性分析 132

    7.3 小 结 140

    7.4 习 题 140

    附录 A 统计 145

    A.1 基本概念 145

    A.2 贝叶斯推理 146

    A.3 分 布 146

    A.4 交叉验证 147

    A.5 A/B 测 试 148

    附录 B R参考 149

    B.1 介 绍 149

    B.2 数据类型 150

    B.3 线性回归 152

    附录 C Python参考 154

    C.1 介 绍 154

    C.2 数据类型 155

    C.3 控 制 流 159

    附录 D 数据科学中的算法和方法术语 163
查看详情
相关图书 / 更多
精通数据科学算法
精通Excel数据统计与分析
李宗璋
精通数据科学算法
精通 Power Query
(加拿大)肯·普尔斯
精通数据科学算法
精通推荐算法:核心模块+经典模型+代码详解
谢杨易
精通数据科学算法
精通式学习法:基于提高学生能力的学习方法(“翻转课堂”先行者乔纳森·伯格曼最新作品,众多教育名家联袂推荐)
(美)乔纳森·伯格曼著,段文静译;中青文 出品
精通数据科学算法
精通STM32F4(HAL库版)(下)
刘军 凌柱宁 徐伟健 江荧
精通数据科学算法
精通STM32F4(HAL库版)(上)
刘军 凌柱宁 徐伟健 江荧
精通数据科学算法
精通FrontPage XP(中文版)
中国IT培训工程编委会 编
精通数据科学算法
精通AI虚拟数字人制作与应用:直播主播+视频博主+营销推广+教育培训 短视频 直播 营销 教育等领域的高效生产力 附赠超值学习资源
木白 编著
精通数据科学算法
精通咬合重建——解读牙列不齐、牙周病、多牙缺失
吴松涛 周茂强 译;[日]上田 秀朗
精通数据科学算法
精通Shiny(Mastering Shiny)
Hadley Wickham
精通数据科学算法
精通Apache Pulsar:可伸缩云原生事件流实践
[美]Jowanza Joseph(乔万扎·约瑟夫
精通数据科学算法
精通嵌入式Linux编程
[美]弗兰克·瓦斯奎兹 著;陈会翔 译
您可能感兴趣 / 更多
精通数据科学算法
心悦读丛书·5分钟疗愈手册
[英]莎拉·克鲁斯比
精通数据科学算法
人体简史(少儿彩绘版),随书附人体拼贴游戏卡,在趣味中掌握人体构造
[英]比尔·布莱森 著;苗德岁 译
精通数据科学算法
万事法则:创造一切可能 [英]理查德·泰普勒
[英]理查德·泰普勒
精通数据科学算法
DK趣味数学百科
[英]卡罗尔·沃德曼
精通数据科学算法
傲慢与偏见(书虫.牛津英汉双语读物升级版六级)
[英]简·奥斯汀
精通数据科学算法
甘地
[英]比库·帕雷赫(Bhikhu Parekh)
精通数据科学算法
牛津妇产科学
[英]萨巴拉特南·阿鲁库马兰 主编
精通数据科学算法
DK汽车大百科(升级修订版)
[英]DK出版社
精通数据科学算法
人体维护说明书
[英]格雷厄姆·劳顿 后浪
精通数据科学算法
全新正版图书 有趣的:货币转转转英国出版社科学普及出版社9787110102237
[英]英国DK出版社
精通数据科学算法
国富论(精装典藏版上下册套装2册)
[英]亚当·斯密
精通数据科学算法
肯尼斯·克拉克:生活、艺术和《文明》
[英]詹姆斯·斯托顿 著