半结构化数据管理关键算法研究与实证

半结构化数据管理关键算法研究与实证
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2018-08
版次: 1
ISBN: 9787520325059
定价: 40.00
装帧: 其他
开本: 16开
纸张: 胶版纸
2人买过
  • 在云计算和物联网等新兴信息技术高速发展的今天,由于半结构化数据具有灵活易扩展的存储结构,已被许多信息系统和应用作为公共数据模型,被广泛地用于大规模异构数据的使用场景中。几乎所有行业都制定了描述和共享本领域数据的半结构化数据模型应用标准。随着半结构化数据的广泛使用,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的研究课题,而在工业界又是一项具有广阔应用前景的技术。本书以XML为代表,探讨了大规模半结构化数据管理中的模式提取、节点编码、索引与查询处理等关键问题。本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。 张引(1986—  ),男,江西九江人,理学博士,现为中南财经政法大学计算机科学与技术系副教授、硕士生导师,长期从事认知计算与智能服务领域的研究,目前主持国家自然科学基金项目2项、教育部人文社会科学研究项目1项;近5年共发表论文80余篇,其中SCI收录超过50篇,并有9篇论文入选ESI高被引论文。在《IEEE Network》《IEEE Access》等国际知名SCI期刊担任编委等职务,曾在《Future Generation Computer Systems》《IEEE IoT Journal》《Electronic Markets》等知名SCI/SSCI期刊担任客座编辑等职务;曾在多个国际学术会议担任大会主席等职务。2014年当选IEEE计算机协会大数据技术委员会副主席,2015年当选IEEE高级会员,2016年入选中南财经政法大学“文澜学者”计划,2017年入选湖北省“楚天学者计划”,2018年获得《IEEE Systems Journal》年度论文奖。 第一章半结构化数据的应用背景(1)

    第一节研究背景(2)

    第二节研究内容及意义(6)

    一 研究内容(6)

    二 研究意义(8)

    第三节本书结构(9)

     

    第二章半结构化数据的基础知识(12)

    第一节半结构化数据的结构特征(12)

    第二节半结构化数据的结构模型(15)

    第三节半结构化数据的模式语言(16)

    第四节半结构化数据的查询语言(17)

    第五节半结构化数据的应用程序接口(19)

     

    第三章半结构化数据的管理模型(22)

    第一节半结构化数据模式提取的相关研究(23)

    第二节半结构化数据节点编码的相关研究(26)

    第三节半结构化数据索引的相关研究(27)

    第四节半结构化数据查询处理的相关研究(30)

     

    第四章半结构化数据的模式提取(33)

    第一节半结构化数据的元素内容模型(34)

    一半结构化数据的树状结构模型(34)

    二半结构化数据的元素内容模型(36)

    三提取大规模半结构化数据模式的质量标准(38)

    第二节基于正则表达式的模式提取方法(39)

    第三节基于集合/序列的模式提取方法——XTree(48)

    第四节实证研究(59)

    第五节小结(72)

     

    第五章半结构化数据的节点编码(75)

    第一节半结构化数据节点编码的特点(76)

    第二节D2编码方案(89)

    第三节D2编码的二进制表示(95)

    第四节实证研究(106)

    第五节小结(109)

     

    第六章半结构化数据的索引和查询处理(111)

    第一节D2-Index索引策略(112)

    第二节基于D2-Index索引策略的查询处理(130)

    第三节实证研究(137)

    第四节小结(140)

     

    第七章半结构化数据与大数据(143)

    第一节大数据时代来临(143)

    第二节大数据基础(146)

    第三节大数据应用(157)

     

    第八章总结(187)

    第一节主要内容(187)

    第二节未来研究展望(189)
  • 内容简介:
    在云计算和物联网等新兴信息技术高速发展的今天,由于半结构化数据具有灵活易扩展的存储结构,已被许多信息系统和应用作为公共数据模型,被广泛地用于大规模异构数据的使用场景中。几乎所有行业都制定了描述和共享本领域数据的半结构化数据模型应用标准。随着半结构化数据的广泛使用,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的研究课题,而在工业界又是一项具有广阔应用前景的技术。本书以XML为代表,探讨了大规模半结构化数据管理中的模式提取、节点编码、索引与查询处理等关键问题。本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。
  • 作者简介:
    张引(1986—  ),男,江西九江人,理学博士,现为中南财经政法大学计算机科学与技术系副教授、硕士生导师,长期从事认知计算与智能服务领域的研究,目前主持国家自然科学基金项目2项、教育部人文社会科学研究项目1项;近5年共发表论文80余篇,其中SCI收录超过50篇,并有9篇论文入选ESI高被引论文。在《IEEE Network》《IEEE Access》等国际知名SCI期刊担任编委等职务,曾在《Future Generation Computer Systems》《IEEE IoT Journal》《Electronic Markets》等知名SCI/SSCI期刊担任客座编辑等职务;曾在多个国际学术会议担任大会主席等职务。2014年当选IEEE计算机协会大数据技术委员会副主席,2015年当选IEEE高级会员,2016年入选中南财经政法大学“文澜学者”计划,2017年入选湖北省“楚天学者计划”,2018年获得《IEEE Systems Journal》年度论文奖。
  • 目录:
    第一章半结构化数据的应用背景(1)

    第一节研究背景(2)

    第二节研究内容及意义(6)

    一 研究内容(6)

    二 研究意义(8)

    第三节本书结构(9)

     

    第二章半结构化数据的基础知识(12)

    第一节半结构化数据的结构特征(12)

    第二节半结构化数据的结构模型(15)

    第三节半结构化数据的模式语言(16)

    第四节半结构化数据的查询语言(17)

    第五节半结构化数据的应用程序接口(19)

     

    第三章半结构化数据的管理模型(22)

    第一节半结构化数据模式提取的相关研究(23)

    第二节半结构化数据节点编码的相关研究(26)

    第三节半结构化数据索引的相关研究(27)

    第四节半结构化数据查询处理的相关研究(30)

     

    第四章半结构化数据的模式提取(33)

    第一节半结构化数据的元素内容模型(34)

    一半结构化数据的树状结构模型(34)

    二半结构化数据的元素内容模型(36)

    三提取大规模半结构化数据模式的质量标准(38)

    第二节基于正则表达式的模式提取方法(39)

    第三节基于集合/序列的模式提取方法——XTree(48)

    第四节实证研究(59)

    第五节小结(72)

     

    第五章半结构化数据的节点编码(75)

    第一节半结构化数据节点编码的特点(76)

    第二节D2编码方案(89)

    第三节D2编码的二进制表示(95)

    第四节实证研究(106)

    第五节小结(109)

     

    第六章半结构化数据的索引和查询处理(111)

    第一节D2-Index索引策略(112)

    第二节基于D2-Index索引策略的查询处理(130)

    第三节实证研究(137)

    第四节小结(140)

     

    第七章半结构化数据与大数据(143)

    第一节大数据时代来临(143)

    第二节大数据基础(146)

    第三节大数据应用(157)

     

    第八章总结(187)

    第一节主要内容(187)

    第二节未来研究展望(189)
查看详情