精通数据科学算法

精通数据科学算法
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [英] (David Natingga) , , ,
2019-05
版次: 1
ISBN: 9787115498168
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 164页
14人买过
  • 数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。

    本书讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。

    本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。 Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。

    他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。 第 1 章 用k最近邻算法解决分类问题

    1.1 Mary对温度的感觉

    1.2 实现k最近邻算法

    1.3 意大利地区的示例——选择k值

    1.4 房屋所有权——数据转换

    1.5 文本分类——使用非欧几里德距离

    1.6 文本分类——更高维度的k-NN

    1.7 小结

    1.8 习题

    第 2 章 朴素贝叶斯

    2.1 医疗检查——贝叶斯定理的基本应用

    2.2 贝叶斯定理的证明及其扩展

    2.3 西洋棋游戏——独立事件

    2.4 朴素贝叶斯分类器的实现

    2.5 西洋棋游戏——相关事件

    2.6 性别分类——基于连续随机变量的贝叶斯定理

    2.7 小结

    2.8 习题

    第 3 章 决策树

    3.1 游泳偏好——用决策树表示数据

    3.2 信息论 044

    3.3 ID3算法——构造决策树 047

    3.4 用决策树进行分类 054

    3.5 小结 060

    3.6 习题 060

    第 4 章 随机森林 064

    4.1 随机森林算法概述 064

    4.2 游泳偏好——随机森林分析法 065

    4.3 随机森林算法的实现 071

    4.4 下棋实例 075

    4.5 购物分析——克服随机数据的不一致性以及

    度量置信水平 082

    4.6 小结 084

    4.7 习题 084

    第 5 章 k-means聚类 089

    5.1 家庭收入——聚类为k个簇 089

    5.2 性别分类——聚类分类 092

    5.3 k-means聚类算法的实现 095

    5.4 房产所有权示例——选择簇的数量 099

    5.5 小结 105

    5.6 习题 105

    第 6 章 回归分析 114

    6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114

    6.2 根据身高预测体重——基于实际数据的线性回归 117

    6.3 梯度下降算法及实现 118

    6.4 根据距离预测飞行时长 122

    6.5 弹道飞行分析——非线性模型 123

    6.6 小 结 125

    6.7 习 题 125

    第 7 章 时间序列分析 130

    7.1 商业利润——趋势分析 130

    7.2 电子商店的销售额——季节性分析 132

    7.3 小 结 140

    7.4 习 题 140

    附录 A 统计 145

    A.1 基本概念 145

    A.2 贝叶斯推理 146

    A.3 分 布 146

    A.4 交叉验证 147

    A.5 A/B 测 试 148

    附录 B R参考 149

    B.1 介 绍 149

    B.2 数据类型 150

    B.3 线性回归 152

    附录 C Python参考 154

    C.1 介 绍 154

    C.2 数据类型 155

    C.3 控 制 流 159

    附录 D 数据科学中的算法和方法术语 163
  • 内容简介:
    数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。

    本书讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。

    本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。
  • 作者简介:
    Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。

    他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。
  • 目录:
    第 1 章 用k最近邻算法解决分类问题

    1.1 Mary对温度的感觉

    1.2 实现k最近邻算法

    1.3 意大利地区的示例——选择k值

    1.4 房屋所有权——数据转换

    1.5 文本分类——使用非欧几里德距离

    1.6 文本分类——更高维度的k-NN

    1.7 小结

    1.8 习题

    第 2 章 朴素贝叶斯

    2.1 医疗检查——贝叶斯定理的基本应用

    2.2 贝叶斯定理的证明及其扩展

    2.3 西洋棋游戏——独立事件

    2.4 朴素贝叶斯分类器的实现

    2.5 西洋棋游戏——相关事件

    2.6 性别分类——基于连续随机变量的贝叶斯定理

    2.7 小结

    2.8 习题

    第 3 章 决策树

    3.1 游泳偏好——用决策树表示数据

    3.2 信息论 044

    3.3 ID3算法——构造决策树 047

    3.4 用决策树进行分类 054

    3.5 小结 060

    3.6 习题 060

    第 4 章 随机森林 064

    4.1 随机森林算法概述 064

    4.2 游泳偏好——随机森林分析法 065

    4.3 随机森林算法的实现 071

    4.4 下棋实例 075

    4.5 购物分析——克服随机数据的不一致性以及

    度量置信水平 082

    4.6 小结 084

    4.7 习题 084

    第 5 章 k-means聚类 089

    5.1 家庭收入——聚类为k个簇 089

    5.2 性别分类——聚类分类 092

    5.3 k-means聚类算法的实现 095

    5.4 房产所有权示例——选择簇的数量 099

    5.5 小结 105

    5.6 习题 105

    第 6 章 回归分析 114

    6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114

    6.2 根据身高预测体重——基于实际数据的线性回归 117

    6.3 梯度下降算法及实现 118

    6.4 根据距离预测飞行时长 122

    6.5 弹道飞行分析——非线性模型 123

    6.6 小 结 125

    6.7 习 题 125

    第 7 章 时间序列分析 130

    7.1 商业利润——趋势分析 130

    7.2 电子商店的销售额——季节性分析 132

    7.3 小 结 140

    7.4 习 题 140

    附录 A 统计 145

    A.1 基本概念 145

    A.2 贝叶斯推理 146

    A.3 分 布 146

    A.4 交叉验证 147

    A.5 A/B 测 试 148

    附录 B R参考 149

    B.1 介 绍 149

    B.2 数据类型 150

    B.3 线性回归 152

    附录 C Python参考 154

    C.1 介 绍 154

    C.2 数据类型 155

    C.3 控 制 流 159

    附录 D 数据科学中的算法和方法术语 163
查看详情
12
相关图书 / 更多
精通数据科学算法
精通Excel数据统计与分析
李宗璋
精通数据科学算法
精通 Power Query
(加拿大)肯·普尔斯
精通数据科学算法
精通推荐算法:核心模块+经典模型+代码详解
谢杨易
精通数据科学算法
精通式学习法:基于提高学生能力的学习方法(“翻转课堂”先行者乔纳森·伯格曼最新作品,众多教育名家联袂推荐)
(美)乔纳森·伯格曼著,段文静译;中青文 出品
精通数据科学算法
精通STM32F4(HAL库版)(下)
刘军 凌柱宁 徐伟健 江荧
精通数据科学算法
精通STM32F4(HAL库版)(上)
刘军 凌柱宁 徐伟健 江荧
精通数据科学算法
精通FrontPage XP(中文版)
中国IT培训工程编委会 编
精通数据科学算法
精通咬合重建——解读牙列不齐、牙周病、多牙缺失
吴松涛 周茂强 译;[日]上田 秀朗
精通数据科学算法
精通Shiny(Mastering Shiny)
Hadley Wickham
精通数据科学算法
精通Apache Pulsar:可伸缩云原生事件流实践
[美]Jowanza Joseph(乔万扎·约瑟夫
精通数据科学算法
精通嵌入式Linux编程
[美]弗兰克·瓦斯奎兹 著;陈会翔 译
精通数据科学算法
精通Transformer:从零开始构建最先进的NLP模型
[伊朗]梅萨姆·阿斯加里-切纳格卢 著;江红 余青松 余靖 译;[土耳其]萨瓦斯·伊尔蒂利姆
您可能感兴趣 / 更多
精通数据科学算法
康德与现代政治哲学
[英] 卡特琳·弗利克舒
精通数据科学算法
权力的支柱(英国史前沿译丛)
[英]约翰·布鲁尔
精通数据科学算法
如何改变世界-(马克思和马克思主义的传奇)
[英]埃里克·霍布斯鲍姆
精通数据科学算法
秘史:英国情报机构的崛起
[英]西蒙·鲍尔
精通数据科学算法
教育与教师教育(教师教育哲学译丛)
[英]理查德·S·彼得斯
精通数据科学算法
羽下之鸟:鸟类骨骼解剖图鉴
[英]卡特里娜·范格鲁 著;沈成 译;未读 出品
精通数据科学算法
非洲大陆简史(萤火虫书系)
[英]阿普里尔·马登
精通数据科学算法
诺奖作家给孩子的阅读课·心智成长(3-9年级,莫言余华的文学启蒙,垫高阅读起点,提升作文能力)
[英]高尔斯华绥等
精通数据科学算法
破茧:认知的深度突围(原书第4版) [英]理查德·泰普勒 [英]理查德·泰普勒
[英]理查德·泰普勒
精通数据科学算法
大英帝国的兴衰:全景式俯瞰英国千年历史沧桑剧变,回首日不落帝国的初升、辉煌与没落
[英]理查德·达吉 著;邵晓燕 魏本超 译;斯坦威 出品
精通数据科学算法
西方服饰与时尚文化:文艺复兴
[英]伊丽莎白·柯里(Elizabeth Currie)
精通数据科学算法
DK魔法百科
[英]DK出版公司 后浪