“十四五”全国统计规划教材:统计学从数据到结论(第五版)

“十四五”全国统计规划教材:统计学从数据到结论(第五版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: ,
2021-11
ISBN: 9787503797057
定价: 48.00
分类: 社会文化
6人买过
  •   这本书已经有了十几年的历史,现在将要出第五版。前面四版已经作为参考书或教科书在许多学校使用。各个学校的师生对该书提出许多宝贵的意见,并且指出了很多错误和不妥之处。读者的支持和鼓励,对该书各版的诞生起着关键的作用。第五版在许多地方对前面几版进行了修改和增减。
      免费的自由编程的开源软件R及Python在国际上已经成为数据科学教学和科研的主要软件,该书第五版全部采用R及Python软件来描述计算过程,R及Python软件非常强大,凡是国际上出现的新方法,都会很快地上传到R的网站上或出现在Python的应用中,不能想象一个涉及数据科学的教师或者研究生不会熟练使用R或者Python。从R和Python的功能和使用者的人数来说,它已经远远超过所有的昂贵的商业软件。R及Python软件的绝大部分程序包或模块的代码都是公开的,透明是防止腐败的好方式。此外,由于R及Python在中国的普及越来越广泛,网上关于R及Python的互动和帮助的环境也已经形成,中国学生和实际工作者完全可以赶上国际统计界使用R及Python的主流。 前言

    第1章 一些基本概念
    1.1 统计:作为数据科学
    1.2 现实中的随机性和规律性,概率和机会
    1.3 变量和数据
    1.4 变量之间的关系
    1.4.1 定性变量间的关系
    1.4.2 定性和定量变量间的混合关系
    1.5 统计、计算机与统计软件
    1.6 本章的Python代码
    1.7 习题

    第2章 数据的收集
    2.1 数据是怎样得到的
    2.2 个体、总体和样本
    2.3 参考资料:抽样调查和一些常用的方法
    2.3.1 概述
    2.3.2 概率抽样例子
    2.3.3 非概率抽样例子
    2.3.4 收集数据时的误差
    2.3.5 问卷调查的问题
    2.4 习题

    第3章 数据的描述
    3.1 如何用图来表示数据
    3.1.1 定量变量的图表示:直方图、盒形图、茎叶图和散点图
    3.1.2 定性变量的图表示:饼图和条形图
    3.1.3 其他图描述法
    3.2 如何用少量数字来概括数据
    3.2.1 数据的“位置”
    3.2.2 数据的“尺度”
    3.2.3 数据的标准得分
    3.3 本章的Python代码
    3 3.1 直方图
    3.3.2 盒形图
    3.3.3 茎叶图
    3.3.4 散点图
    3.3.5 饼图
    3.3.6 条形图
    3.3.7 数据的标准得分
    3.4 习题

    第4章 机会的度量:概率和分布
    4.1 得到概率的几种途径
    4.2 概率的运算
    4.3 变量的分布
    4.3.1 离散随机变量
    4.3.2 离散分布例子:二项分布
    4.3.3 离散分布例子:多项分布
    4.3.4 离散分布例子:Poisson分布
    4.3.5 离散分布例子:超几何分布
    4.3.6 连续随机变量
    4.3.7 累积分布函数
    4.3.8 连续分布例子:正态分布
    4.3.9 通过正态分布说明连续分布的概率
    4.3.10 连续分布例子:均匀分布
    4.3.11 实际数据中变量的经验分布
    4.4 抽样分布
    4.4.1 什么是抽样分布
    4.4.2 中心极限定理
    4.5 本章的Python代码
    4.5.1 二项分布
    4.5.2 Poisson分布
    4.5.3 连续随机变量的分布
    4.5.4 正态分布
    4.5.5 均匀分布
    4.5.6 经验分布
    4.5.7 抽样分布
    4.6 习题

    第5章 有监督学习――回归和分类
    5.1 问题的提出
    5.1.1 多变量相互作用的真实世界
    5.1.2 数据科学的核心是有监督学习的预测
    5.2 通过数据案例理解有监督学习:分类问题
    5.2.1 例5.1欺诈竞标数据
    5.2.2 探索性数据分析
    5.2.3 建立一个决策树分类模型
    5.2.4 如何选择分类决策树的拆分变量
    5.2.5 预测精度的交叉验证
    5.2.6 例5.1欺诈竞标数据决策树分类的变量重要性
    5.3 通过数据案例理解有监督学习:回归问题
    5.3.1 例5.2混凝土强度数据
    5.3.2 探索性数据分析
    5.3.3 建立一个决策树回归模型
    5.3.4 如何选择回归决策树的拆分变量
    5.3.5 回归中的交叉验证预测精度与残差的区别
    5.3.6 例5.2 混凝土强度数据回归预测精度的交叉验证
    5.3.7 例5.2 混凝土强度数据决策树回归的变量重要性
    5.4 若干有监督学习模型
    5.4.1 更多的例子
    5.4.2 两类模型的概述及交叉验证
    5.4.3 bagging分类和回归
    5.4.4 adaboost分类
    5.4.5 随机森林分类和回归
    5.4.6 SVM分类和回归
    5.4.7 最小二乘线性回归
    5.4.8 用于二分类的logistic回归
    5.4.9 线性判别分析分类
    5.5 本章自编R函数和一些作图代码
    5.5.1 平衡分类因变量各水平的分折函数
    5.5.2 单独模型的分类交叉验证函数(只用于本章的模型)
    5.5.3 单独模型的回归交叉验证函数(只用于本章的模型)
    5.5.4 课文中一些图的代码
    5.6 本章的Python代码
    5.6.1 -些需要的模块
    5.6.2 通过数据案例理解有监督学习:分类问题
    5.6.3 通过数据案例理解有监督学习:回归问题
    5.6.4 模型的概述及交叉验证
    5.6.5 bagging分类和回归
    5.6.6 adaboost分类
    5 6 7 随机森林分类和回归
    5.6.8 SVM分类和回归
    5.6.9 最小二乘线性回归
    5.6.10 Iogistic回归二分类
    5.6.11 线性判别分析做多分类
    5.6.12 本章要用的一些Python自编函数
    5.7 参考资料
    5.7.1 线性判别分析的一些数学细节
    5.7.2 支持向量机的一些数学细节
    5.8 习题

    第6章 无监督学习――多元分析
    6.1 寻找多个变量的代表:主成分分析和因子分析
    6.1.1 主成分分析
    6.1.2 因子分析
    6.1.3 因子分析和主成分分析的一些注意事项
    6.2 把对象分类:聚类分析
    6.2.1 如何度量距离远近?
    6.2.2 事先要确定分多少类:k均值聚类
    6.2.3 事先不用确定分多少类:分层聚类
    6.2.4 聚类要注意的问题
    6.3 两组变量之间的相关:典型相关分析
    6.3.1 两组变量的相关问题
    6.3.2 典型相关分析
    6.4 列联表行变量和列变量的关系:对应分析
    6.5 参考资料:一些概括及公式
    6.5.1 主成分分析和因子分析
    6.5.2 聚类分析
    6.5.3 典型相关分析
    6.5.4 对应分析
    6.6 本章的Python代码
    6.6.1 主成分分析
    6.6.2 因子分析
    6.6.3 聚类分析
    6.6.4 典型相关分析
    6.6.5 对应分析
    6.7 习题
    ……
    第7章 随时间变化的对象:时间序列分析
    第8章 生存分析简介
    第9章 基本软件:R和Python
    第10章 附录:统计显著性:假设检验和区间估计
    参考文献
  • 内容简介:
      这本书已经有了十几年的历史,现在将要出第五版。前面四版已经作为参考书或教科书在许多学校使用。各个学校的师生对该书提出许多宝贵的意见,并且指出了很多错误和不妥之处。读者的支持和鼓励,对该书各版的诞生起着关键的作用。第五版在许多地方对前面几版进行了修改和增减。
      免费的自由编程的开源软件R及Python在国际上已经成为数据科学教学和科研的主要软件,该书第五版全部采用R及Python软件来描述计算过程,R及Python软件非常强大,凡是国际上出现的新方法,都会很快地上传到R的网站上或出现在Python的应用中,不能想象一个涉及数据科学的教师或者研究生不会熟练使用R或者Python。从R和Python的功能和使用者的人数来说,它已经远远超过所有的昂贵的商业软件。R及Python软件的绝大部分程序包或模块的代码都是公开的,透明是防止腐败的好方式。此外,由于R及Python在中国的普及越来越广泛,网上关于R及Python的互动和帮助的环境也已经形成,中国学生和实际工作者完全可以赶上国际统计界使用R及Python的主流。
  • 目录:
    前言

    第1章 一些基本概念
    1.1 统计:作为数据科学
    1.2 现实中的随机性和规律性,概率和机会
    1.3 变量和数据
    1.4 变量之间的关系
    1.4.1 定性变量间的关系
    1.4.2 定性和定量变量间的混合关系
    1.5 统计、计算机与统计软件
    1.6 本章的Python代码
    1.7 习题

    第2章 数据的收集
    2.1 数据是怎样得到的
    2.2 个体、总体和样本
    2.3 参考资料:抽样调查和一些常用的方法
    2.3.1 概述
    2.3.2 概率抽样例子
    2.3.3 非概率抽样例子
    2.3.4 收集数据时的误差
    2.3.5 问卷调查的问题
    2.4 习题

    第3章 数据的描述
    3.1 如何用图来表示数据
    3.1.1 定量变量的图表示:直方图、盒形图、茎叶图和散点图
    3.1.2 定性变量的图表示:饼图和条形图
    3.1.3 其他图描述法
    3.2 如何用少量数字来概括数据
    3.2.1 数据的“位置”
    3.2.2 数据的“尺度”
    3.2.3 数据的标准得分
    3.3 本章的Python代码
    3 3.1 直方图
    3.3.2 盒形图
    3.3.3 茎叶图
    3.3.4 散点图
    3.3.5 饼图
    3.3.6 条形图
    3.3.7 数据的标准得分
    3.4 习题

    第4章 机会的度量:概率和分布
    4.1 得到概率的几种途径
    4.2 概率的运算
    4.3 变量的分布
    4.3.1 离散随机变量
    4.3.2 离散分布例子:二项分布
    4.3.3 离散分布例子:多项分布
    4.3.4 离散分布例子:Poisson分布
    4.3.5 离散分布例子:超几何分布
    4.3.6 连续随机变量
    4.3.7 累积分布函数
    4.3.8 连续分布例子:正态分布
    4.3.9 通过正态分布说明连续分布的概率
    4.3.10 连续分布例子:均匀分布
    4.3.11 实际数据中变量的经验分布
    4.4 抽样分布
    4.4.1 什么是抽样分布
    4.4.2 中心极限定理
    4.5 本章的Python代码
    4.5.1 二项分布
    4.5.2 Poisson分布
    4.5.3 连续随机变量的分布
    4.5.4 正态分布
    4.5.5 均匀分布
    4.5.6 经验分布
    4.5.7 抽样分布
    4.6 习题

    第5章 有监督学习――回归和分类
    5.1 问题的提出
    5.1.1 多变量相互作用的真实世界
    5.1.2 数据科学的核心是有监督学习的预测
    5.2 通过数据案例理解有监督学习:分类问题
    5.2.1 例5.1欺诈竞标数据
    5.2.2 探索性数据分析
    5.2.3 建立一个决策树分类模型
    5.2.4 如何选择分类决策树的拆分变量
    5.2.5 预测精度的交叉验证
    5.2.6 例5.1欺诈竞标数据决策树分类的变量重要性
    5.3 通过数据案例理解有监督学习:回归问题
    5.3.1 例5.2混凝土强度数据
    5.3.2 探索性数据分析
    5.3.3 建立一个决策树回归模型
    5.3.4 如何选择回归决策树的拆分变量
    5.3.5 回归中的交叉验证预测精度与残差的区别
    5.3.6 例5.2 混凝土强度数据回归预测精度的交叉验证
    5.3.7 例5.2 混凝土强度数据决策树回归的变量重要性
    5.4 若干有监督学习模型
    5.4.1 更多的例子
    5.4.2 两类模型的概述及交叉验证
    5.4.3 bagging分类和回归
    5.4.4 adaboost分类
    5.4.5 随机森林分类和回归
    5.4.6 SVM分类和回归
    5.4.7 最小二乘线性回归
    5.4.8 用于二分类的logistic回归
    5.4.9 线性判别分析分类
    5.5 本章自编R函数和一些作图代码
    5.5.1 平衡分类因变量各水平的分折函数
    5.5.2 单独模型的分类交叉验证函数(只用于本章的模型)
    5.5.3 单独模型的回归交叉验证函数(只用于本章的模型)
    5.5.4 课文中一些图的代码
    5.6 本章的Python代码
    5.6.1 -些需要的模块
    5.6.2 通过数据案例理解有监督学习:分类问题
    5.6.3 通过数据案例理解有监督学习:回归问题
    5.6.4 模型的概述及交叉验证
    5.6.5 bagging分类和回归
    5.6.6 adaboost分类
    5 6 7 随机森林分类和回归
    5.6.8 SVM分类和回归
    5.6.9 最小二乘线性回归
    5.6.10 Iogistic回归二分类
    5.6.11 线性判别分析做多分类
    5.6.12 本章要用的一些Python自编函数
    5.7 参考资料
    5.7.1 线性判别分析的一些数学细节
    5.7.2 支持向量机的一些数学细节
    5.8 习题

    第6章 无监督学习――多元分析
    6.1 寻找多个变量的代表:主成分分析和因子分析
    6.1.1 主成分分析
    6.1.2 因子分析
    6.1.3 因子分析和主成分分析的一些注意事项
    6.2 把对象分类:聚类分析
    6.2.1 如何度量距离远近?
    6.2.2 事先要确定分多少类:k均值聚类
    6.2.3 事先不用确定分多少类:分层聚类
    6.2.4 聚类要注意的问题
    6.3 两组变量之间的相关:典型相关分析
    6.3.1 两组变量的相关问题
    6.3.2 典型相关分析
    6.4 列联表行变量和列变量的关系:对应分析
    6.5 参考资料:一些概括及公式
    6.5.1 主成分分析和因子分析
    6.5.2 聚类分析
    6.5.3 典型相关分析
    6.5.4 对应分析
    6.6 本章的Python代码
    6.6.1 主成分分析
    6.6.2 因子分析
    6.6.3 聚类分析
    6.6.4 典型相关分析
    6.6.5 对应分析
    6.7 习题
    ……
    第7章 随时间变化的对象:时间序列分析
    第8章 生存分析简介
    第9章 基本软件:R和Python
    第10章 附录:统计显著性:假设检验和区间估计
    参考文献
查看详情