Python金融数据挖掘与分析实战

Python金融数据挖掘与分析实战
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: ,
2021-12
版次: 1
ISBN: 9787111696506
定价: 109.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 416页
8人买过
  • 内容简介 

    这是一本金融数据挖掘与分析领域的实战性著作,它能指导零Python编程基础和零数据挖掘与分析基础的读者快速掌握金融数据挖掘与分析的工具、技术和方法。 

    读完本书,你将会有如下3个方面的收获: 

    (1)Python编程基础和数据预处理 

    首先详细讲解了Python的核心语法,以及NumPy、Matplotlib、PySpark、Jupyter Notebook等Python数据处理工具的使用;然后详细介绍了数据预处理的流程和技巧。通过深入浅出的语言和丰富的样例展示,帮助初学者快速上手 Python,为之后的数据分析实战夯实基础。 

    (2)数据挖掘与分析的经典方法 

    详细讲解了经典的数据挖掘方法,包括聚类分析、回归分析、分类分析、异常检测、关联分析、时间序列分析等。 

    (3)主要金融应用场景的数据挖掘方法 

    针对网络舆情的采集和热点分析、舆情分析中的情感分析、股价趋势预测、个人信用评分、企业信用评分、用户画像、目标客户精准分析、销售数据分析等金融行业的常见应用场景,给出了数据挖掘和分析的方法。 

    本书注重实战,配有大量精心设计的案例,同时还有配套的视频讲解、代码和数据资源,可操作性强。 作者介绍 

    刘鹏 

    教授,清华大学博士,云计算、大数据和人工智能领域的知名专家,南京云创大数据科技股份有限公司总裁、中国大数据应用联盟人工智能专家委员会主任。 

    中国电子学会云计算专家委员会云存储组组长、工业和信息化部云计算研究中心专家。中国信息协会教育分会人工智能教育专家委员会主任、教育部全国普通高校毕业生就业创业指导委员会委员、“2019年全国大学生数学建模比赛”命题人、“第45届世界技能大赛”中国区云计算选拔赛裁判长/专家指导组组长、2002 PennySort国际计算机排序比赛冠军与2003年全国挑战杯总冠军。提出的反垃圾邮件网格,被IEEE Cluster 2003评为杰出网格项目,为解决困扰全球的垃圾邮件问题做出根本贡献,该技术成为云安全技术的基础。 

    高中强 

    人工智能与大数据领域技术专家,有非常深厚的积累,擅长机器学习和自然语言处理,尤其是深度学习,熟悉Tensorflow、PyTorch等深度学习开发框架。 

    曾获“2019年全国大学生数学建模优秀命题人奖”。参与钟南山院士指导新型冠状病毒人工智能预测系统研发项目,与钟南山院士团队共同发表学术论文《Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions》。合著有参《人工智能:从小白到大神》、《人工智能数学基础》等著作。 前 言 

    第1章 Python工作环境准备 1 

    1.1 Anaconda环境安装 1 

    1.2 常用Python 交互工具 4 

    1.3 Jupyter Notebook简介 6 

    1.4 习题 9 

    第2章 Python入门 10 

    2.1 Python基础知识 10 

    2.2 Python基础语法 11 

    2.3 Python变量类型 15 

    2.4 Python运算符 20 

    2.4.1 算术运算符 20 

    2.4.2 比较运算符 22 

    2.4.3 赋值运算符 23 

    2.4.4 按位运算符 24 

    2.4.5 逻辑运算符 25 

    2.4.6 成员运算符 26 

    2.4.7 身份运算符 27 

    2.4.8 运算符优先级 28 

    2.5 Python条件与循环语句 29 

    2.5.1 条件语句 29 

    2.5.2 循环语句 31 

    2.6 Python函数 38 

    2.7 Python模块 43 

    2.8 Python 文件处理 46 

    2.9 Python异常 48 

    2.10 数据分析相关库 50 

    2.10.1 NumPy 50 

    2.10.2 Matplotlib 51 

    2.10.3 PySpark 53 

    2.10.4 其他常用库 54 

    2.11 习题 55 

    第3章 数据预处理 56 

    3.1 数据分析工作流程 56 

    3.2 数据预处理 58 

    3.2.1 数据集导入 59 

    3.2.2 数据概览 60 

    3.2.3 数据清洗 61 

    3.2.4 类别变量转换 66 

    3.2.5 数据分割 67 

    3.2.6 特征缩放 68 

    3.3 鸟瞰机器学习 71 

    3.4 习题 72 

    第4章 数据挖掘方法 74 

    4.1 分类分析 74 

    4.1.1 决策树 75 

    4.1.2 支持向量机 75 

    4.1.3 分类算法的选择 76 

    4.2 聚类分析 76 

    4.2.1 K均值算法 77 

    4.2.2 聚类算法和分类算法的区别 78 

    4.3 回归分析 78 

    4.3.1 变量间的关系 79 

    4.3.2 回归分析算法的分类和步骤 79 

    4.3.3 回归分析算法的选择 81 

    4.4 关联分析 81 

    4.4.1 关联规则 82 

    4.4.2 关联规则的序列模式 82 

    4.5 时间序列分析 83 

    4.5.1 时间序列分析方法和步骤 83 

    4.5.2 时间序列的三种预测模式 85 

    4.6 异常检测 85 

    4.7 推荐算法 86 

    4.8 习题 89 

    第5章 网络舆情采集与热点分析 90 

    5.1 网络舆情概述 90 

    5.1.1 大数据网络舆情背景 90 

    5.1.2 舆情处理过程 91 

    5.2 舆情数据采集 94 

    5.2.1 网络舆情采集工具 95 

    5.2.2 网络舆情数据爬取实例 100 

    5.3 实战:微博热点话题聚类 104 

    5.4 习题 110 

    第6章 舆情研判之情感分类 112 

    6.1 情感分析介绍 112 

    6.1.1 情感分析分类 112 

    6.1.2 情感分析文本预处理 114 

    6.1.3 实战:中文文本处理练习 115 

    6.2 情感分类方法 118 

    6.2.1 基于词典的情感分类 118 

    6.2.2 基于机器学习的情感分类 121 

    6.2.3 基于深度学习模型的情感分类 122 

    6.3 情感分类实战演练 131 

    6.3.1 淘宝家电商品评论情感分类预测 131 

    6.3.2 京东客户评论情感倾向预测 134 

    6.4 习题 140 

    第7章 用机器学习方法预测股价 142 

    7.1 股市数据分析价值 142 

    7.1.1 案例背景 142 

    7.1.2 案例价值 143 

    7.2 ARIMA模型 144 

    7.3 实战:基于SVM和ARIMA的股价预测 145 

    7.4 习题 156 

    第8章 用人工智能方法预测股价 157 

    8.1 神经网络预测方法 157 

    8.1.1 门控循环单元 158 

    8.1.2 VADER情感分析 158 

    8.2 实战:基于LSTM和GRU的股价预测 159 

    8.3 实战:股票市场新闻情感分析 165 

    8.4 习题 172 

    第9章 个人信用评分 173 

    9.1 个人信用评分概述 173 

    9.1.1 需求背景 174 

    9.1.2 国内外发展状况 175 

    9.2 信用评分的技术与方法 176 

    9.2.1 信用评分的简要历史 176 

    9.2.2 信用评分的主要模型与方法 176 

    9.3 信用评分卡模型 180 

    9.3.1 模型介绍 180 

    9.3.2 数据分箱 180 

    9.3.3 WOE值 182 

    9.3.4 IV值 183 

    9.3.5 逻辑回归算法原理 185 

    9.3.6 模型评价指标 186 

    9.3.7 建立信用评分卡 190 

    9.4 实战:信用评分卡 190 

    9.4.1 读取数据 191 

    9.4.2 数据预处理 191 

    9.4.3 探索性分析 197 

    9.4.4 模型分析 204 

    9.4.5 建立信用评分卡 208 

    9.5 习题 211 

    第10章 个人信用等级评估 213 

    10.1 概述 213 

    10.2 个人信用等级评估方法 215 

    10.2.1 决策树 215 

    10.2.2 随机森林 221 

    10.2.3 XGBoost简介 224 

    10.2.4 多重共线性 228 

    10.2.5 数据重采样 229 

    10.3 实战:个人信用等级评估 232 

    10.3.1 导入相应包并读取数据 232 

    10.3.2 查看数据情况 234 

    10.3.3 数据预处理及相关函数构建 241 

    10.3.4 模型训练 244 

    10.3.5 预测并生成结果 251 

    10.4 习题 253 

    第11章 企业信用评估 255 

    11.1 企业信用评估概述 255 

    11.2 企业信用评估的技术与方法 257 

    11.2.1 支持向量机 257 

    11.2.2 朴素贝叶斯 259 

    11.2.3
  • 内容简介:
    内容简介 

    这是一本金融数据挖掘与分析领域的实战性著作,它能指导零Python编程基础和零数据挖掘与分析基础的读者快速掌握金融数据挖掘与分析的工具、技术和方法。 

    读完本书,你将会有如下3个方面的收获: 

    (1)Python编程基础和数据预处理 

    首先详细讲解了Python的核心语法,以及NumPy、Matplotlib、PySpark、Jupyter Notebook等Python数据处理工具的使用;然后详细介绍了数据预处理的流程和技巧。通过深入浅出的语言和丰富的样例展示,帮助初学者快速上手 Python,为之后的数据分析实战夯实基础。 

    (2)数据挖掘与分析的经典方法 

    详细讲解了经典的数据挖掘方法,包括聚类分析、回归分析、分类分析、异常检测、关联分析、时间序列分析等。 

    (3)主要金融应用场景的数据挖掘方法 

    针对网络舆情的采集和热点分析、舆情分析中的情感分析、股价趋势预测、个人信用评分、企业信用评分、用户画像、目标客户精准分析、销售数据分析等金融行业的常见应用场景,给出了数据挖掘和分析的方法。 

    本书注重实战,配有大量精心设计的案例,同时还有配套的视频讲解、代码和数据资源,可操作性强。
  • 作者简介:
    作者介绍 

    刘鹏 

    教授,清华大学博士,云计算、大数据和人工智能领域的知名专家,南京云创大数据科技股份有限公司总裁、中国大数据应用联盟人工智能专家委员会主任。 

    中国电子学会云计算专家委员会云存储组组长、工业和信息化部云计算研究中心专家。中国信息协会教育分会人工智能教育专家委员会主任、教育部全国普通高校毕业生就业创业指导委员会委员、“2019年全国大学生数学建模比赛”命题人、“第45届世界技能大赛”中国区云计算选拔赛裁判长/专家指导组组长、2002 PennySort国际计算机排序比赛冠军与2003年全国挑战杯总冠军。提出的反垃圾邮件网格,被IEEE Cluster 2003评为杰出网格项目,为解决困扰全球的垃圾邮件问题做出根本贡献,该技术成为云安全技术的基础。 

    高中强 

    人工智能与大数据领域技术专家,有非常深厚的积累,擅长机器学习和自然语言处理,尤其是深度学习,熟悉Tensorflow、PyTorch等深度学习开发框架。 

    曾获“2019年全国大学生数学建模优秀命题人奖”。参与钟南山院士指导新型冠状病毒人工智能预测系统研发项目,与钟南山院士团队共同发表学术论文《Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions》。合著有参《人工智能:从小白到大神》、《人工智能数学基础》等著作。
  • 目录:
    前 言 

    第1章 Python工作环境准备 1 

    1.1 Anaconda环境安装 1 

    1.2 常用Python 交互工具 4 

    1.3 Jupyter Notebook简介 6 

    1.4 习题 9 

    第2章 Python入门 10 

    2.1 Python基础知识 10 

    2.2 Python基础语法 11 

    2.3 Python变量类型 15 

    2.4 Python运算符 20 

    2.4.1 算术运算符 20 

    2.4.2 比较运算符 22 

    2.4.3 赋值运算符 23 

    2.4.4 按位运算符 24 

    2.4.5 逻辑运算符 25 

    2.4.6 成员运算符 26 

    2.4.7 身份运算符 27 

    2.4.8 运算符优先级 28 

    2.5 Python条件与循环语句 29 

    2.5.1 条件语句 29 

    2.5.2 循环语句 31 

    2.6 Python函数 38 

    2.7 Python模块 43 

    2.8 Python 文件处理 46 

    2.9 Python异常 48 

    2.10 数据分析相关库 50 

    2.10.1 NumPy 50 

    2.10.2 Matplotlib 51 

    2.10.3 PySpark 53 

    2.10.4 其他常用库 54 

    2.11 习题 55 

    第3章 数据预处理 56 

    3.1 数据分析工作流程 56 

    3.2 数据预处理 58 

    3.2.1 数据集导入 59 

    3.2.2 数据概览 60 

    3.2.3 数据清洗 61 

    3.2.4 类别变量转换 66 

    3.2.5 数据分割 67 

    3.2.6 特征缩放 68 

    3.3 鸟瞰机器学习 71 

    3.4 习题 72 

    第4章 数据挖掘方法 74 

    4.1 分类分析 74 

    4.1.1 决策树 75 

    4.1.2 支持向量机 75 

    4.1.3 分类算法的选择 76 

    4.2 聚类分析 76 

    4.2.1 K均值算法 77 

    4.2.2 聚类算法和分类算法的区别 78 

    4.3 回归分析 78 

    4.3.1 变量间的关系 79 

    4.3.2 回归分析算法的分类和步骤 79 

    4.3.3 回归分析算法的选择 81 

    4.4 关联分析 81 

    4.4.1 关联规则 82 

    4.4.2 关联规则的序列模式 82 

    4.5 时间序列分析 83 

    4.5.1 时间序列分析方法和步骤 83 

    4.5.2 时间序列的三种预测模式 85 

    4.6 异常检测 85 

    4.7 推荐算法 86 

    4.8 习题 89 

    第5章 网络舆情采集与热点分析 90 

    5.1 网络舆情概述 90 

    5.1.1 大数据网络舆情背景 90 

    5.1.2 舆情处理过程 91 

    5.2 舆情数据采集 94 

    5.2.1 网络舆情采集工具 95 

    5.2.2 网络舆情数据爬取实例 100 

    5.3 实战:微博热点话题聚类 104 

    5.4 习题 110 

    第6章 舆情研判之情感分类 112 

    6.1 情感分析介绍 112 

    6.1.1 情感分析分类 112 

    6.1.2 情感分析文本预处理 114 

    6.1.3 实战:中文文本处理练习 115 

    6.2 情感分类方法 118 

    6.2.1 基于词典的情感分类 118 

    6.2.2 基于机器学习的情感分类 121 

    6.2.3 基于深度学习模型的情感分类 122 

    6.3 情感分类实战演练 131 

    6.3.1 淘宝家电商品评论情感分类预测 131 

    6.3.2 京东客户评论情感倾向预测 134 

    6.4 习题 140 

    第7章 用机器学习方法预测股价 142 

    7.1 股市数据分析价值 142 

    7.1.1 案例背景 142 

    7.1.2 案例价值 143 

    7.2 ARIMA模型 144 

    7.3 实战:基于SVM和ARIMA的股价预测 145 

    7.4 习题 156 

    第8章 用人工智能方法预测股价 157 

    8.1 神经网络预测方法 157 

    8.1.1 门控循环单元 158 

    8.1.2 VADER情感分析 158 

    8.2 实战:基于LSTM和GRU的股价预测 159 

    8.3 实战:股票市场新闻情感分析 165 

    8.4 习题 172 

    第9章 个人信用评分 173 

    9.1 个人信用评分概述 173 

    9.1.1 需求背景 174 

    9.1.2 国内外发展状况 175 

    9.2 信用评分的技术与方法 176 

    9.2.1 信用评分的简要历史 176 

    9.2.2 信用评分的主要模型与方法 176 

    9.3 信用评分卡模型 180 

    9.3.1 模型介绍 180 

    9.3.2 数据分箱 180 

    9.3.3 WOE值 182 

    9.3.4 IV值 183 

    9.3.5 逻辑回归算法原理 185 

    9.3.6 模型评价指标 186 

    9.3.7 建立信用评分卡 190 

    9.4 实战:信用评分卡 190 

    9.4.1 读取数据 191 

    9.4.2 数据预处理 191 

    9.4.3 探索性分析 197 

    9.4.4 模型分析 204 

    9.4.5 建立信用评分卡 208 

    9.5 习题 211 

    第10章 个人信用等级评估 213 

    10.1 概述 213 

    10.2 个人信用等级评估方法 215 

    10.2.1 决策树 215 

    10.2.2 随机森林 221 

    10.2.3 XGBoost简介 224 

    10.2.4 多重共线性 228 

    10.2.5 数据重采样 229 

    10.3 实战:个人信用等级评估 232 

    10.3.1 导入相应包并读取数据 232 

    10.3.2 查看数据情况 234 

    10.3.3 数据预处理及相关函数构建 241 

    10.3.4 模型训练 244 

    10.3.5 预测并生成结果 251 

    10.4 习题 253 

    第11章 企业信用评估 255 

    11.1 企业信用评估概述 255 

    11.2 企业信用评估的技术与方法 257 

    11.2.1 支持向量机 257 

    11.2.2 朴素贝叶斯 259 

    11.2.3
查看详情
12
相关图书 / 更多
Python金融数据挖掘与分析实战
Python和PySpark数据分析
(加)乔纳森·里乌
Python金融数据挖掘与分析实战
Python机器学习入门与实践 从深度学习到生成对抗网络GAN 深入浅出GAN生成对抗网络 实战gan TensorFlow与Keras 人工智能技术书籍
(日)大关真之
Python金融数据挖掘与分析实战
Python语言程序设计
王刚
Python金融数据挖掘与分析实战
Python代码编程 学科项目式编程(六年级)
冯建刚
Python金融数据挖掘与分析实战
Python机器学习 : 核心技术与开发实战 周志华西瓜书机器学习实战伴侣书
[美]普拉提克·乔希 著;李现伟 译者;颉腾文化 出品;阿尔伯托·阿尔塔桑切斯(美);曾小健
Python金融数据挖掘与分析实战
Python语言程序设计(微课版)
宁爱军 何志永
Python金融数据挖掘与分析实战
Python数据分析从入门到精通(第2版)
明日科技
Python金融数据挖掘与分析实战
Python数据分析与挖掘
齐福利
Python金融数据挖掘与分析实战
Python基础与应用(互联网+教育新形态一体化系列教材)
李喆时、谢家立、赵丽 编
Python金融数据挖掘与分析实战
Python数据分析与可视化项目实战
王振丽
Python金融数据挖掘与分析实战
Python爬虫从菜鸟到高手
李宁
Python金融数据挖掘与分析实战
Python程序设计基础教程
\"孙海龙 王济军\
您可能感兴趣 / 更多
Python金融数据挖掘与分析实战
食品分析与检验
刘鹏、李达、李晓阳、侯婷、路冠茹 编
Python金融数据挖掘与分析实战
人工智能从小白到大神(案例·视频)
刘鹏、曹骝、吴彩云、张燕 著
Python金融数据挖掘与分析实战
星丛曜煜--南京大学本科生哲学通识论文集
刘鹏、邵佳德 著
Python金融数据挖掘与分析实战
计算广告互联网商业变现的市场与技术第2版全彩精装版
刘鹏、王超 著
Python金融数据挖掘与分析实战
会计信息化(用友ERP-U8V10.1)/高等职业教育财务会计类专业创新教材
刘鹏、王忠孝、陈晨 编
Python金融数据挖掘与分析实战
计算广告互联网商业变现的市场与技术第2版
刘鹏、王超 著
Python金融数据挖掘与分析实战
电子技术基础(第2版)
刘鹏、李进、刘旭、赵红利 编
Python金融数据挖掘与分析实战
数据标注工程/大数据应用人才培养系列教材
刘鹏、张燕 著
Python金融数据挖掘与分析实战
国防金融论
刘鹏、李聪 著
Python金融数据挖掘与分析实战
Python语言/大数据应用人才培养系列教材
刘鹏、张燕、李肖俊、钟涛、刘河 著
Python金融数据挖掘与分析实战
铸魂砺剑/全民国防教育读本
刘鹏、苏进 著
Python金融数据挖掘与分析实战
谈兵论剑
刘鹏、苏进 主编