大数据管理系统原理与技术

大数据管理系统原理与技术
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: , , ,
2020-01
版次: 1
ISBN: 9787111636779
定价: 69.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 334页
16人买过
  •   《大数据管理系统原理与技术》介绍了多种数据库管理系统的基本概念以及代表性数据库管理系统的使用和优化方法,覆盖了传统的关系数据库、数据仓库,以及列族、键值、文档、图等NoSQL数据库系统。
      通过阅读《大数据管理系统原理与技术》,读者可以较全面地了解支撑大数据应用所需的数据库管理系统的概念、特征和相关技术,并且可以学习代表性关系数据库系统的使用方法,将理论和实际相结合。
      《大数据管理系统原理与技术》可作为大数据相关专业本科生和研究生教材,也可供从事大数据相关工作的工程技术人员参考使用。
      要进行有效的大数据处理和计算,选择适当的数据库管理系统并对其进行配置、编程和调优是非常关键的环节。在大数据场景下,单一的数据库管理系统无法满足所有类型数据管理的需要,因此大数据相关专业的学生和从业者需要了解不同类型的数据库管理系统,以解决不同场景下的实际问题。
      《大数据管理系统原理与技术》基于作者多年的教学和工程经验编写而成,旨在帮助读者掌握面向大数据的数据库管理系统的原理和应用方法。   王宏志,哈尔滨工业大学计算机科学与技术学院教授、博士生导师,英才学院副院长。研究方向为大数据、数据科学、数据管理与分析。在VLDB、SIGMOD等国内外重要会议和期刊上发表学术论文200余篇,出版学术专著两本,其论文被SCI收录50余次,他引千余次。获黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获黑龙江省青年科技奖、宝钢优秀教师奖等。先后主持10余个国家自然科学基金重点项目、国家支撑计划课题、国家博士后特别资助项目等。主讲的MOOC课程“大数据算法”入选第一批全国精品在线开放课程。主要社会兼职有ACMSIGMOD中国秘书长、ACM数据科学学科标准编写组专家、中国计算机学会数据库专业委员会常务委员、黑龙江省数据科学与大数据技术专业委员会副主任委员、中国计算机学会大数据专家委员会委员等。
      
      何震瀛,博士,复旦大学计算机科学学院副教授,中国计算机学会数据库专业委员会委员、大数据专业委员会通信委员。主要研究兴趣是数据管理和数据分析等。主持和参加20余项预研、核高基、863、国家自然科学基金项目。多年来,在数据管理、数据分析等方面进行了大量研究工作,发表论文70余篇。在海量数据管理和分析方面,作为独立开发者完成并行海量信息查询和分析系统的开发,实现了海量信息的秒级分析;该软件连同硬件平台一起,获得国家科技进步二等奖。参与研发的数据库系统已应用在国家海洋局某重大专项中(作为数据的保险箱)。
      
      王鹏,毕业于哈尔滨工业大学软件工程专业,研究生学历。曾就职于中国普天信息技术研究院,并担任架构师、技术总监等职使。曾代表企业主导网络存储国家行业标准制定,拥有相关专利3项。2013年开始从事大数据领域的技术研发工作。现就职于北京华育兴业科技有限公司,任首席技术官,主要从事金融、电信、电力及教育等行业海量数据分析挖掘工作。主要社会兼职包括中国大数据与智能计算产业联盟副秘书长、甲骨文大数据专家、黑龙江省人工智能学会理事、四川省计算机协会理事等,致力于帮助全国高校进行大数据及人工智能专业的建设与咨询工作。
      
      李春静,工学硕士,现任北京华育兴业科技有限公司大数据讲师,并承担高校大数据技术与应用资源建设工作。主要从事Hadoop、HBase、Hive、Spark、大数据库、机器学习等课程研发工作。研究兴趣为大数据应用、机器学习和智能自动化。曾以首作者在国内核心期刊上发表论文2篇,参与大型煤矿信息化项目1个、国家医疗大数据项目2个。参与编写大数据教材1本。 本书编委会
    前言
    第1章 绪论
    1.1 大数据的基本概念
    1.2 数据库管理系统
    1.2.1 数据库管理系统的基本概念
    1.2.2 数据库管理系统的发展历史
    1.2.3 数据库管理系统的要素
    1.3 大数据对数据库管理系统的需求和挑战
    1.4 本书结构

    第2章 关系型数据库管理系统
    2.1 关系数据库概述
    2.1.1 关系模型
    2.1.2 关系数据的存储
    2.1.3 关系数据库的索引
    2.1.4 关系数据库中的查询处理算法
    2.1.5 并发控制
    2.1.6 数据库恢复
    2.2 关系数据库MySQL概述
    2.3 MySQL应用
    2.3.1 SQL概述
    2.3.2 数据定义语句
    2.3.3 数据处理语句
    2.3.4 事务和锁定声明
    2.3.5 其他
    2.4 存储过程
    2.4.1 概述
    2.4.2 建立存储过程
    2.4.3 调用存储过程
    2.4.4 查询存储过程
    2.4.5 删除存储过程
    2.5 视图
    2.6 分区
    2.7 复制
    2.8 MySQL的Java客户端JDBC
    2.8.1 JDBC概述
    2.8.2 JDBCAPI
    2.8.3 Java通过JDBCAPI操作MySQL

    第3章 数据仓库Hive
    3.1 数据仓库概述
    3.1.1 数据仓库的概念和特征
    3.1.2 数据仓库的体系结构
    3.1.3 数据仓库的模型
    3.1.4 数据仓库关键技术
    3.1.5 数据仓库与大数据
    3.2 Hive概述
    3.2.1 Hive存储结构
    3.2.2 Hive体系结构
    3.2.3 Hive的任务执行流程
    3.3 Hive的特征
    3.3.1 一致性
    3.3.2 可扩展性
    3.3.3 事务
    3.4 Hive的基本概念
    3.4.1 基本数据类型
    3.4.2 数据类型转换
    3.4.3 复杂数据类型
    3.4.4 文本文件数据编码
    3.4.5 数据读取模式
    3.4.6 文件格式与压缩
    3.4.7 Hive压缩
    3.4.8 Hive关键字
    3.5 Hive的使用
    3.5.1 Hive命令
    3.5.2 HiveDDL
    3.5.3 HiveDML
    3.5.4 HiveQL基本查询
    3.5.5 Hive函数
    3.5.6 HiveQL高级查询
    3.6 面向大数据的优化策略
    3.6.1 分桶
    3.6.2 视图和索引
    3.6.3 模式设计
    3.7 Hive的调优
    3.7.1 使用EXPLAIN查看执行计划
    3.7.2 Hive配置管理
    3.7.3 限制调整
    3.7.4 JOIN优化
    3.7.5 本地模式
    3.7.6 并行执行
    3.7.7 严格模式
    3.7.8 调整Mapper和Reducer个数
    3.7.9 JVM重用
    3.7.10 动态分区调整
    3.7.11 推测执行
    3.7.12 单个MapReduce中的多个GROUPBY
    3.7.13 虚拟列
    3.8 Java通过JDBC操作Hive
    ……

    第4章 NoSQL概述
    第5章 键值数据库
    第6章 列族数据库
    第7章 非关系型文档数据库
    第8章 非关系型图数据库
  • 内容简介:
      《大数据管理系统原理与技术》介绍了多种数据库管理系统的基本概念以及代表性数据库管理系统的使用和优化方法,覆盖了传统的关系数据库、数据仓库,以及列族、键值、文档、图等NoSQL数据库系统。
      通过阅读《大数据管理系统原理与技术》,读者可以较全面地了解支撑大数据应用所需的数据库管理系统的概念、特征和相关技术,并且可以学习代表性关系数据库系统的使用方法,将理论和实际相结合。
      《大数据管理系统原理与技术》可作为大数据相关专业本科生和研究生教材,也可供从事大数据相关工作的工程技术人员参考使用。
      要进行有效的大数据处理和计算,选择适当的数据库管理系统并对其进行配置、编程和调优是非常关键的环节。在大数据场景下,单一的数据库管理系统无法满足所有类型数据管理的需要,因此大数据相关专业的学生和从业者需要了解不同类型的数据库管理系统,以解决不同场景下的实际问题。
      《大数据管理系统原理与技术》基于作者多年的教学和工程经验编写而成,旨在帮助读者掌握面向大数据的数据库管理系统的原理和应用方法。
  • 作者简介:
      王宏志,哈尔滨工业大学计算机科学与技术学院教授、博士生导师,英才学院副院长。研究方向为大数据、数据科学、数据管理与分析。在VLDB、SIGMOD等国内外重要会议和期刊上发表学术论文200余篇,出版学术专著两本,其论文被SCI收录50余次,他引千余次。获黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获黑龙江省青年科技奖、宝钢优秀教师奖等。先后主持10余个国家自然科学基金重点项目、国家支撑计划课题、国家博士后特别资助项目等。主讲的MOOC课程“大数据算法”入选第一批全国精品在线开放课程。主要社会兼职有ACMSIGMOD中国秘书长、ACM数据科学学科标准编写组专家、中国计算机学会数据库专业委员会常务委员、黑龙江省数据科学与大数据技术专业委员会副主任委员、中国计算机学会大数据专家委员会委员等。
      
      何震瀛,博士,复旦大学计算机科学学院副教授,中国计算机学会数据库专业委员会委员、大数据专业委员会通信委员。主要研究兴趣是数据管理和数据分析等。主持和参加20余项预研、核高基、863、国家自然科学基金项目。多年来,在数据管理、数据分析等方面进行了大量研究工作,发表论文70余篇。在海量数据管理和分析方面,作为独立开发者完成并行海量信息查询和分析系统的开发,实现了海量信息的秒级分析;该软件连同硬件平台一起,获得国家科技进步二等奖。参与研发的数据库系统已应用在国家海洋局某重大专项中(作为数据的保险箱)。
      
      王鹏,毕业于哈尔滨工业大学软件工程专业,研究生学历。曾就职于中国普天信息技术研究院,并担任架构师、技术总监等职使。曾代表企业主导网络存储国家行业标准制定,拥有相关专利3项。2013年开始从事大数据领域的技术研发工作。现就职于北京华育兴业科技有限公司,任首席技术官,主要从事金融、电信、电力及教育等行业海量数据分析挖掘工作。主要社会兼职包括中国大数据与智能计算产业联盟副秘书长、甲骨文大数据专家、黑龙江省人工智能学会理事、四川省计算机协会理事等,致力于帮助全国高校进行大数据及人工智能专业的建设与咨询工作。
      
      李春静,工学硕士,现任北京华育兴业科技有限公司大数据讲师,并承担高校大数据技术与应用资源建设工作。主要从事Hadoop、HBase、Hive、Spark、大数据库、机器学习等课程研发工作。研究兴趣为大数据应用、机器学习和智能自动化。曾以首作者在国内核心期刊上发表论文2篇,参与大型煤矿信息化项目1个、国家医疗大数据项目2个。参与编写大数据教材1本。
  • 目录:
    本书编委会
    前言
    第1章 绪论
    1.1 大数据的基本概念
    1.2 数据库管理系统
    1.2.1 数据库管理系统的基本概念
    1.2.2 数据库管理系统的发展历史
    1.2.3 数据库管理系统的要素
    1.3 大数据对数据库管理系统的需求和挑战
    1.4 本书结构

    第2章 关系型数据库管理系统
    2.1 关系数据库概述
    2.1.1 关系模型
    2.1.2 关系数据的存储
    2.1.3 关系数据库的索引
    2.1.4 关系数据库中的查询处理算法
    2.1.5 并发控制
    2.1.6 数据库恢复
    2.2 关系数据库MySQL概述
    2.3 MySQL应用
    2.3.1 SQL概述
    2.3.2 数据定义语句
    2.3.3 数据处理语句
    2.3.4 事务和锁定声明
    2.3.5 其他
    2.4 存储过程
    2.4.1 概述
    2.4.2 建立存储过程
    2.4.3 调用存储过程
    2.4.4 查询存储过程
    2.4.5 删除存储过程
    2.5 视图
    2.6 分区
    2.7 复制
    2.8 MySQL的Java客户端JDBC
    2.8.1 JDBC概述
    2.8.2 JDBCAPI
    2.8.3 Java通过JDBCAPI操作MySQL

    第3章 数据仓库Hive
    3.1 数据仓库概述
    3.1.1 数据仓库的概念和特征
    3.1.2 数据仓库的体系结构
    3.1.3 数据仓库的模型
    3.1.4 数据仓库关键技术
    3.1.5 数据仓库与大数据
    3.2 Hive概述
    3.2.1 Hive存储结构
    3.2.2 Hive体系结构
    3.2.3 Hive的任务执行流程
    3.3 Hive的特征
    3.3.1 一致性
    3.3.2 可扩展性
    3.3.3 事务
    3.4 Hive的基本概念
    3.4.1 基本数据类型
    3.4.2 数据类型转换
    3.4.3 复杂数据类型
    3.4.4 文本文件数据编码
    3.4.5 数据读取模式
    3.4.6 文件格式与压缩
    3.4.7 Hive压缩
    3.4.8 Hive关键字
    3.5 Hive的使用
    3.5.1 Hive命令
    3.5.2 HiveDDL
    3.5.3 HiveDML
    3.5.4 HiveQL基本查询
    3.5.5 Hive函数
    3.5.6 HiveQL高级查询
    3.6 面向大数据的优化策略
    3.6.1 分桶
    3.6.2 视图和索引
    3.6.3 模式设计
    3.7 Hive的调优
    3.7.1 使用EXPLAIN查看执行计划
    3.7.2 Hive配置管理
    3.7.3 限制调整
    3.7.4 JOIN优化
    3.7.5 本地模式
    3.7.6 并行执行
    3.7.7 严格模式
    3.7.8 调整Mapper和Reducer个数
    3.7.9 JVM重用
    3.7.10 动态分区调整
    3.7.11 推测执行
    3.7.12 单个MapReduce中的多个GROUPBY
    3.7.13 虚拟列
    3.8 Java通过JDBC操作Hive
    ……

    第4章 NoSQL概述
    第5章 键值数据库
    第6章 列族数据库
    第7章 非关系型文档数据库
    第8章 非关系型图数据库
查看详情
12
相关图书 / 更多
大数据管理系统原理与技术
大数学家讲故事:李毓佩数学童话-数学小子杜鲁克
李毓佩
大数据管理系统原理与技术
大数据驱动的突发事件情报感知及快速响应研究
唐明伟,庄玉良
大数据管理系统原理与技术
大数据处理技术基础与应用(Hadoop+Spark)
许桂秋 孙海民 胡贵恒
大数据管理系统原理与技术
大数据警务的崛起
(美)安德鲁.格思里.弗格森
大数据管理系统原理与技术
大数据时代图书馆服务体系的创新与发展
程结晶
大数据管理系统原理与技术
大数据观下的国家情报工作制度研究
马海群 等
大数据管理系统原理与技术
大数据时代政府治理转型研究-(数字政府建设的江苏实践)
范炜烽等著
大数据管理系统原理与技术
大数据环境下数字图书馆创新发展
金济
大数据管理系统原理与技术
大数据背景下公众参与环境治理的程度评估与作用机制研究
史亚东
大数据管理系统原理与技术
大数据医疗:从即时检测设备进行解析
(英)波利亚·阿梅里安,(英)特鲁迪·朗,(英)弗朗索瓦·范·洛格伦伯格
大数据管理系统原理与技术
大数据可视化编程和应用
倪振松 胡煜华 朱家全 主编 谢岳富 陈建平 副主编
大数据管理系统原理与技术
大数据思想政治教育模式构建研究(国家社科基金丛书—其他)
林晶 著
您可能感兴趣 / 更多
大数据管理系统原理与技术
大数据计算系统:原理、技术与应用
王宏志 刘海龙 张立臣 石胜飞 编著
大数据管理系统原理与技术
龙与狮的对话: 翻译与马戛尔尼访华使团
王宏志
大数据管理系统原理与技术
大数据治理:理论与方法
王宏志
大数据管理系统原理与技术
翻译史研究(2018)
王宏志
大数据管理系统原理与技术
国之重器出版工程大数据清洗技术
王宏志 著
大数据管理系统原理与技术
翻译史研究(2017)
王宏志 著
大数据管理系统原理与技术
Hadoop集群程序设计与开发
王宏志、李春静 著
大数据管理系统原理与技术
大数据分析原理与实践
王宏志 著
大数据管理系统原理与技术
翻译史研究(2016)
王宏志 编
大数据管理系统原理与技术
新中国中小学教材建设史1949-2000研究丛书:历史卷
王宏志 著
大数据管理系统原理与技术
C语言程序设计
王宏志、韩志明 主编
大数据管理系统原理与技术
鲁迅与“左联”
王宏志