数据科学概论(数据科学与大数据技术丛书)

数据科学概论(数据科学与大数据技术丛书)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2021-03
版次: 1
ISBN: 9787300290607
定价: 46.00
装帧: 其他
开本: 32开
纸张: 胶版纸
字数: 405千字
48人买过
  • 作为问题导向、数据驱动的交叉学科,数据科学要求研究者具备扎实的知识储备、高效的编程能力以及广阔的研究视野。本书尝试以概论的形式对数据科学的缘起、内涵、技术、工具、原则、方法、平台、产品、应用等展开讨论,帮助读者建立完整的知识体系与专业逻辑。全书划分为四个部分:*部分是绪论,鸟瞰数据科学的概念、历史与应用;第二部分是基础技能,涵盖编程工具、数学基础与统计原则;第三部分是分析方法,遵从从探索性到验证性的数据分析思路,阐释数据可视化方法,讲解面向结构化数据的机器学习与人工智能模型,并讨论非结构化数据的分析技术;第四部分是数据应用,从业界视角介绍数据库、大数据平台、可重复研究的理念与实践,并以互联网、零售、金融、医疗健康四个行业为例展开实战讨论。 李扬 中国人民大学统计学院教授、博士生导师,副院长、统计咨询研究中心主任;国际统计学会推选会员、中国商业统计学会副会长、北京生物医学统计与数据管理研究会监事长、北京大数据协会综合评价专业委员会主任委员。主要从事相关型数据分析、模型选择与不确定性评价、潜变量建模、临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,发表JASA、JAMA?IM、Biometrics、Biostatistics、统计研究等国内外期刊研究论文五十余篇。

    李舰 统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。 第 1章绪论 

    1.1数据科学的概念 

    1.1.1数据科学的研究对象

    1.1.2常见的数据科学方法 

    1.2数据科学的发展变迁 

    1.2.1数据科学的前身:统计学 

    1.2.2当代统计学:数据科学 

    1.3数据科学的应用领域 

    1.3.1互联网行业 

    1.3.2零售行业 

    1.3.3金融行业 

    1.3.4医疗健康行业 

    第 2章数据科学的编程工具 

    2.1 R简介 

    2.1.1安装和设置 

    2.1.2基础操作 

    2.1.3数据结构 

    2.1.4基础语法 

    2.2 Python和数据科学 

    2.2.1安装和使用 

    2.2.2数据结构 

    2.2.3基础语法 

    2.3 Julia简介 

    2.3.1安装和使用 

    2.3.2编程基础

    第 3章数据科学的数学基础

    3.1线性代数

    3.1.1向量基础

    3.1.2矩阵运算

    3.2概率论和数理统计

    3.2.1随机变量和分布

    3.2.2数理统计简介

    3.3最优化方法

    3.3.1非线性规划

    3.3.2线性规划

    第 4章数据科学的统计原则

    4.1可重复原则

    4.1.1数据的扰动

    4.1.2模型的扰动

    4.2可预测原则

    4.2.1可预测性

    4.2.2交叉验证

    4.3可计算原则

    4.3.1大数据时代的数据特征

    4.3.2大规模数据的处理方法

    4.3.3高维 /超高维数据的处理方法

    第 5章数据可视化 

    5.1基础统计图形 

    5.1.1图形设备 

    5.1.2基础作图 

    5.1.3 ggplot绘图语言 

    5.2可视化与数据分析 

    5.2.1单变量的分布 

    5.2.2两变量的关系 

    5.2.3多变量的关系 

    5.3现代数据可视化方法 

    5.3.1动态统计图形 

    5.3.2交互式工具 

    第 6章数据挖掘和机器学习 

    6.1从海量数据到大数据 

    6.1.1海量数据与数据挖掘 

    6.1.2大数据与机器学习 

    6.2无监督学习 

    6.2.1主成分分析 

    6.2.2聚类分析 

    6.3有监督学习 

    6.3.1回归分析 

    6.3.2分类问题和分类性能评估 

    6.3.3常用分类模型 

    第 7章人工智能 

    7.1人工智能简史 

    7.1.1人工智能的发展历史 

    7.1.2从神经网络到深度学习 

    7.2神经网络简介 

    7.2.1神经网络模型 

    7.2.2感知机的学习 

    7.2.3 BP算法 

    7.3深度学习基础 

    7.3.1常见深度学习框架 

    7.3.2 MXNet简介 

    7.3.3深度学习实战 

    第 8章非结构化数据分析 

    8.1图像分析 

    8.1.1图像处理基础 

    8.1.2卷积神经网络 

    8.1.3图像分类示例 

    8.2文本分析

    8.2.1文本数据的处理

    8.2.2文本分类示例

    8.2.3句法分析

    8.3音频分析

    8.3.1音频数据的处理

    8.3.2音频特征的提取

    第 9章数据库和数据仓库

    9.1数据结构简介

    9.1.1数据的测量尺度

    9.1.2数据的基础类型

    9.1.3数据的逻辑结构

    9.2数据库和 SQL

    9.2.1数据库基础介绍

    9.2.2常见的数据库产品

    9.2.3 SQL语句简介

    9.3数据仓库和商业智能

    9.3.1数据仓库基础介绍

    9.3.2数据仓库的多维模型

    9.3.3 BI分析简介

    第 10章大数据平台

    10.1大数据和云计算

    10.1.1大数据技术的发展变迁

    10.1.2云计算简介

    10.2并行计算框架

    10.2.1并行计算简介

    10.2.2共享内存和 GPU计算

    10.2.3
  • 内容简介:
    作为问题导向、数据驱动的交叉学科,数据科学要求研究者具备扎实的知识储备、高效的编程能力以及广阔的研究视野。本书尝试以概论的形式对数据科学的缘起、内涵、技术、工具、原则、方法、平台、产品、应用等展开讨论,帮助读者建立完整的知识体系与专业逻辑。全书划分为四个部分:*部分是绪论,鸟瞰数据科学的概念、历史与应用;第二部分是基础技能,涵盖编程工具、数学基础与统计原则;第三部分是分析方法,遵从从探索性到验证性的数据分析思路,阐释数据可视化方法,讲解面向结构化数据的机器学习与人工智能模型,并讨论非结构化数据的分析技术;第四部分是数据应用,从业界视角介绍数据库、大数据平台、可重复研究的理念与实践,并以互联网、零售、金融、医疗健康四个行业为例展开实战讨论。
  • 作者简介:
    李扬 中国人民大学统计学院教授、博士生导师,副院长、统计咨询研究中心主任;国际统计学会推选会员、中国商业统计学会副会长、北京生物医学统计与数据管理研究会监事长、北京大数据协会综合评价专业委员会主任委员。主要从事相关型数据分析、模型选择与不确定性评价、潜变量建模、临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,发表JASA、JAMA?IM、Biometrics、Biostatistics、统计研究等国内外期刊研究论文五十余篇。

    李舰 统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。
  • 目录:
    第 1章绪论 

    1.1数据科学的概念 

    1.1.1数据科学的研究对象

    1.1.2常见的数据科学方法 

    1.2数据科学的发展变迁 

    1.2.1数据科学的前身:统计学 

    1.2.2当代统计学:数据科学 

    1.3数据科学的应用领域 

    1.3.1互联网行业 

    1.3.2零售行业 

    1.3.3金融行业 

    1.3.4医疗健康行业 

    第 2章数据科学的编程工具 

    2.1 R简介 

    2.1.1安装和设置 

    2.1.2基础操作 

    2.1.3数据结构 

    2.1.4基础语法 

    2.2 Python和数据科学 

    2.2.1安装和使用 

    2.2.2数据结构 

    2.2.3基础语法 

    2.3 Julia简介 

    2.3.1安装和使用 

    2.3.2编程基础

    第 3章数据科学的数学基础

    3.1线性代数

    3.1.1向量基础

    3.1.2矩阵运算

    3.2概率论和数理统计

    3.2.1随机变量和分布

    3.2.2数理统计简介

    3.3最优化方法

    3.3.1非线性规划

    3.3.2线性规划

    第 4章数据科学的统计原则

    4.1可重复原则

    4.1.1数据的扰动

    4.1.2模型的扰动

    4.2可预测原则

    4.2.1可预测性

    4.2.2交叉验证

    4.3可计算原则

    4.3.1大数据时代的数据特征

    4.3.2大规模数据的处理方法

    4.3.3高维 /超高维数据的处理方法

    第 5章数据可视化 

    5.1基础统计图形 

    5.1.1图形设备 

    5.1.2基础作图 

    5.1.3 ggplot绘图语言 

    5.2可视化与数据分析 

    5.2.1单变量的分布 

    5.2.2两变量的关系 

    5.2.3多变量的关系 

    5.3现代数据可视化方法 

    5.3.1动态统计图形 

    5.3.2交互式工具 

    第 6章数据挖掘和机器学习 

    6.1从海量数据到大数据 

    6.1.1海量数据与数据挖掘 

    6.1.2大数据与机器学习 

    6.2无监督学习 

    6.2.1主成分分析 

    6.2.2聚类分析 

    6.3有监督学习 

    6.3.1回归分析 

    6.3.2分类问题和分类性能评估 

    6.3.3常用分类模型 

    第 7章人工智能 

    7.1人工智能简史 

    7.1.1人工智能的发展历史 

    7.1.2从神经网络到深度学习 

    7.2神经网络简介 

    7.2.1神经网络模型 

    7.2.2感知机的学习 

    7.2.3 BP算法 

    7.3深度学习基础 

    7.3.1常见深度学习框架 

    7.3.2 MXNet简介 

    7.3.3深度学习实战 

    第 8章非结构化数据分析 

    8.1图像分析 

    8.1.1图像处理基础 

    8.1.2卷积神经网络 

    8.1.3图像分类示例 

    8.2文本分析

    8.2.1文本数据的处理

    8.2.2文本分类示例

    8.2.3句法分析

    8.3音频分析

    8.3.1音频数据的处理

    8.3.2音频特征的提取

    第 9章数据库和数据仓库

    9.1数据结构简介

    9.1.1数据的测量尺度

    9.1.2数据的基础类型

    9.1.3数据的逻辑结构

    9.2数据库和 SQL

    9.2.1数据库基础介绍

    9.2.2常见的数据库产品

    9.2.3 SQL语句简介

    9.3数据仓库和商业智能

    9.3.1数据仓库基础介绍

    9.3.2数据仓库的多维模型

    9.3.3 BI分析简介

    第 10章大数据平台

    10.1大数据和云计算

    10.1.1大数据技术的发展变迁

    10.1.2云计算简介

    10.2并行计算框架

    10.2.1并行计算简介

    10.2.2共享内存和 GPU计算

    10.2.3
查看详情
相关图书 / 更多
数据科学概论(数据科学与大数据技术丛书)
数据治理实践者手记
苏振中
数据科学概论(数据科学与大数据技术丛书)
数据中台:让数据用起来 第2版 付登坡 等
付登坡 江敏 赵东辉 等
数据科学概论(数据科学与大数据技术丛书)
数据对话:建立你的数据流利度
(瑞士)马丁·埃普勒 法比耶纳 宾兹利
数据科学概论(数据科学与大数据技术丛书)
数据结构高分(2025版 天勤3版) 大中专公共计算机 率辉 新华正版
率辉
数据科学概论(数据科学与大数据技术丛书)
数据资源管理 陈忆金 奉国和
陈忆金 奉国和
数据科学概论(数据科学与大数据技术丛书)
数据工程之道:设计和构建健壮的数据系统 [美]乔·里斯 [美]马特·豪斯利
[美]乔·里斯(Joe Reis),[美]马特·豪斯利(Matt Housley)
数据科学概论(数据科学与大数据技术丛书)
数据法学前沿
武长海
数据科学概论(数据科学与大数据技术丛书)
数据结构与算法入门到提高(Python语言实现)
谭琨、韦韬 编著
数据科学概论(数据科学与大数据技术丛书)
数据合规与网络安全风险防范
冯洋
数据科学概论(数据科学与大数据技术丛书)
数据加密与PKI应用(微课版)
王秀英
数据科学概论(数据科学与大数据技术丛书)
数据治理驱动的数字化转型 王建峰 辛华
王建峰 辛华
数据科学概论(数据科学与大数据技术丛书)
数据资产保护的合规要点与实务
辛小天,周杨,史蕾