大数据技术丛书:Storm分布式实时计算模式

大数据技术丛书:Storm分布式实时计算模式
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , [美] ,
2015-01
版次: 1
ISBN: 9787111484387
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 252页
正文语种: 简体中文
原版书名: Storm Blueprints Patterns for Distributed Real-Time Computation
47人买过
  •   《Storm分布式实时计算模式》由ApacheStorm项目核心贡献者吉奥兹、奥尼尔亲笔撰写,融合了作者丰富的Storm实战经验,通过大量示例,全面而系统地讲解使用Storm进行分布式实时计算的核心概念及应用,并针对不同的应用场景,给出多种基于Storm的设计模式,为读者快速掌握Storms分布式实时计算提供系统实践指南。
      《Storm分布式实时计算模式》分为10章:第l章介绍使用storm建立一个分布式流式计算应用所涉及的核心概念,包括storm的数据结构、开发环境的搭建,以及Storm程序的开发和调试技术等;第2章详细讲解storm集群环境的安装和搭建,以及如何将topology部署到分布式环境中;第3章通过传感器数据实例详细介绍Tridenttopology;第4章讲解如何使用Storm和Tridentj挂行实时趋势分析;第5章介绍如何使用Storm进行图形分析,将数据持久化存储在图形数据库中,通过查询数据来发现其中潜在的联系;第6章讲解如何在Storm上使用递归实现一个典型的人工智能算法;第7章演示集成Storm和非事务型系统的复杂性,通过集成Storm和开源探索性分析架构Druid实现一个可配置的实时系统来分析金融事件。
      第8章探讨Lambda体系结构的实现方法,讲解如何将批处理机制和实时处理引擎结合起来构建一个可纠错的分析系统;第9章讲解如何将Pig脚本转化为topology,并且使用Storm-YARN部署topology,从而将批处理系统转化为实时系统;第10章介绍如何在云服务提供商提供的主机环境下部署和运行Storm。
      P. Taylor Goetz是Apache Storm项目核心贡献者以及发布经理,自2011年10月Storm项目首次开源至今都参与其中,具有长期的Storm使用和开发经验。作为Storm用户社区中的活跃贡献者,Taylor领导了一系列开源项目,旨在使企业能够将Storm集成到不同的基础设施上。

      Brian O'Neill 现就职于Health Market Science(HMS)公司,任首席技术官,重点进行数据管理和医疗领域数据分析。他已经担任技术主管超过15年,被公认为大数据领域的权威。作为系统架构师,他有着应对各种不同场景的经验,从初创公司到财富500强公司。他信奉开源精神,对多个项目做出了贡献。他领导的项目,扩展了Cassandra数据库,并且将索引引擎、分布式处理框架、分析引擎集成到了该数据库中。他荣获了2013年InfoWorld技术领导力奖项。

      译者简介

      董昭 腾讯安全平台部应用运维安全工程师,负责腾讯Web业务的漏洞防护等相关工作,研究兴趣为Web安全、网络安全、Linux后台开发、大数据等。 前言
    作者简介
    第1章 分布式单词计数
    1.1 Storm topology的组成部分——stream、spout和bolt
    1.1.1 Storm
    1.1.2 spout
    1.1.3 bolt
    1.2 单词计数topology的数据流
    1.2.1 语句生成bolt
    1.2.2 语句分割bolt
    1.2.3 单词计割bolt
    1.2.4 上报bolt
    1.3 实现单词计数top
    1.3.1 配置开发环境
    1.3.2 实现Sentence
    1.3.3 实现语句分割bolt
    1.3.4 实现单词计割bolt
    1.3.5 实现上报bolt
    1.3.6 实现单词计数topo
    1.4 Storm的并发机制
    1.4.1 WordCountTopology的并发机制
    1.4.2 给topology增加woker
    1.4.3 配置executor和task
    1.5 理解数据流分组
    1.6 有保障机制的数据处理
    1.6.1 spout的可靠性
    1.6.2 bolt的可靠性
    1.6.3 可靠的单词计数
    总结

    第2章 配置Storm集群
    2.1 Storm集群的框架
    2.1.1 理解nimbus守护进程
    2.1.2 supervisor守护进程的工作方式
    2.1.3 Apache ZooKeeper简介
    ……
    第3章 Trident和传感器数据
    第4章 实时趋势分析
    第5章 实时图形分析
    第6章 人工智能
    第7章 整合Druid进行金融分析
    第8章 自然语言处理
    第9章 在Hadoop上部署Storm进行广告分析
    第10章 云环境下的S
  • 内容简介:
      《Storm分布式实时计算模式》由ApacheStorm项目核心贡献者吉奥兹、奥尼尔亲笔撰写,融合了作者丰富的Storm实战经验,通过大量示例,全面而系统地讲解使用Storm进行分布式实时计算的核心概念及应用,并针对不同的应用场景,给出多种基于Storm的设计模式,为读者快速掌握Storms分布式实时计算提供系统实践指南。
      《Storm分布式实时计算模式》分为10章:第l章介绍使用storm建立一个分布式流式计算应用所涉及的核心概念,包括storm的数据结构、开发环境的搭建,以及Storm程序的开发和调试技术等;第2章详细讲解storm集群环境的安装和搭建,以及如何将topology部署到分布式环境中;第3章通过传感器数据实例详细介绍Tridenttopology;第4章讲解如何使用Storm和Tridentj挂行实时趋势分析;第5章介绍如何使用Storm进行图形分析,将数据持久化存储在图形数据库中,通过查询数据来发现其中潜在的联系;第6章讲解如何在Storm上使用递归实现一个典型的人工智能算法;第7章演示集成Storm和非事务型系统的复杂性,通过集成Storm和开源探索性分析架构Druid实现一个可配置的实时系统来分析金融事件。
      第8章探讨Lambda体系结构的实现方法,讲解如何将批处理机制和实时处理引擎结合起来构建一个可纠错的分析系统;第9章讲解如何将Pig脚本转化为topology,并且使用Storm-YARN部署topology,从而将批处理系统转化为实时系统;第10章介绍如何在云服务提供商提供的主机环境下部署和运行Storm。
  • 作者简介:
      P. Taylor Goetz是Apache Storm项目核心贡献者以及发布经理,自2011年10月Storm项目首次开源至今都参与其中,具有长期的Storm使用和开发经验。作为Storm用户社区中的活跃贡献者,Taylor领导了一系列开源项目,旨在使企业能够将Storm集成到不同的基础设施上。

      Brian O'Neill 现就职于Health Market Science(HMS)公司,任首席技术官,重点进行数据管理和医疗领域数据分析。他已经担任技术主管超过15年,被公认为大数据领域的权威。作为系统架构师,他有着应对各种不同场景的经验,从初创公司到财富500强公司。他信奉开源精神,对多个项目做出了贡献。他领导的项目,扩展了Cassandra数据库,并且将索引引擎、分布式处理框架、分析引擎集成到了该数据库中。他荣获了2013年InfoWorld技术领导力奖项。

      译者简介

      董昭 腾讯安全平台部应用运维安全工程师,负责腾讯Web业务的漏洞防护等相关工作,研究兴趣为Web安全、网络安全、Linux后台开发、大数据等。
  • 目录:
    前言
    作者简介
    第1章 分布式单词计数
    1.1 Storm topology的组成部分——stream、spout和bolt
    1.1.1 Storm
    1.1.2 spout
    1.1.3 bolt
    1.2 单词计数topology的数据流
    1.2.1 语句生成bolt
    1.2.2 语句分割bolt
    1.2.3 单词计割bolt
    1.2.4 上报bolt
    1.3 实现单词计数top
    1.3.1 配置开发环境
    1.3.2 实现Sentence
    1.3.3 实现语句分割bolt
    1.3.4 实现单词计割bolt
    1.3.5 实现上报bolt
    1.3.6 实现单词计数topo
    1.4 Storm的并发机制
    1.4.1 WordCountTopology的并发机制
    1.4.2 给topology增加woker
    1.4.3 配置executor和task
    1.5 理解数据流分组
    1.6 有保障机制的数据处理
    1.6.1 spout的可靠性
    1.6.2 bolt的可靠性
    1.6.3 可靠的单词计数
    总结

    第2章 配置Storm集群
    2.1 Storm集群的框架
    2.1.1 理解nimbus守护进程
    2.1.2 supervisor守护进程的工作方式
    2.1.3 Apache ZooKeeper简介
    ……
    第3章 Trident和传感器数据
    第4章 实时趋势分析
    第5章 实时图形分析
    第6章 人工智能
    第7章 整合Druid进行金融分析
    第8章 自然语言处理
    第9章 在Hadoop上部署Storm进行广告分析
    第10章 云环境下的S
查看详情
相关图书 / 更多
大数据技术丛书:Storm分布式实时计算模式
大数据分析方法
林正炎 张朋 梁克维 庞天晓
大数据技术丛书:Storm分布式实时计算模式
大数据十讲 周烜 陈志广
周烜 陈志广
大数据技术丛书:Storm分布式实时计算模式
大数据财务分析
李峰
大数据技术丛书:Storm分布式实时计算模式
大数据时代的营销管理创新研究
高芳 著
大数据技术丛书:Storm分布式实时计算模式
大数据侦查法治化研究
彭俊磊
大数据技术丛书:Storm分布式实时计算模式
大数据时代高校思想政治教育的创新与实践
胡蓉、刘叶、王雁 著
大数据技术丛书:Storm分布式实时计算模式
大数据哲学——大数据技术革命的哲学问题研究
黄欣荣 著
大数据技术丛书:Storm分布式实时计算模式
大数据医疗:从即时检测设备进行解析
(英)波利亚·阿梅里安,(英)特鲁迪·朗,(英)弗朗索瓦·范·洛格伦伯格
大数据技术丛书:Storm分布式实时计算模式
大数据环境下移动社交网络个性化隐私保护技术研究
王平水 著
大数据技术丛书:Storm分布式实时计算模式
大数据应用蓝皮书:中国大数据应用发展报告No.7(2023)
陈军君;吴红星;张晓波;端木凌
大数据技术丛书:Storm分布式实时计算模式
大数据财务与会计应用
周忠宝 著;樊斌、樊斌、周忠宝 编
大数据技术丛书:Storm分布式实时计算模式
大数据下税收风险业务场景应用
李崇西
您可能感兴趣 / 更多
大数据技术丛书:Storm分布式实时计算模式
NASA火星探索简史
[美]皮尔斯·比佐尼
大数据技术丛书:Storm分布式实时计算模式
有效地招聘:掌握面试策略、背景调查和入职培训 职场领导力提升系列丛书
[美],保罗·法尔科内(Paul,Falcone)
大数据技术丛书:Storm分布式实时计算模式
永生的海拉:划时代的癌细胞和时代洪流下的细胞主人一家 外国现当代文学 [美]丽贝卡·思科鲁特 新华正版
[美]丽贝卡·思科鲁特
大数据技术丛书:Storm分布式实时计算模式
进阶书系-思考,好与坏:如何用哲学拯救你的逻辑与理性
[美]史蒂文·纳德勒 [美]劳伦斯·夏皮罗
大数据技术丛书:Storm分布式实时计算模式
漫长的告别(雷蒙德·钱德勒无可争议的代表作,全新修订译本)
[美]雷蒙德·钱德勒
大数据技术丛书:Storm分布式实时计算模式
公益让广告收益更大:公益广告在创意和甲方之间的平衡艺术
[美]伊多·塔沃里,[美]索尼娅·普雷拉特,[美]雪莉·罗恩
大数据技术丛书:Storm分布式实时计算模式
丧钟为谁而鸣(是海明威广为流传的长篇代表之一,文学与历史的宿命相遇)
[美]欧内斯特·海明威
大数据技术丛书:Storm分布式实时计算模式
永别了,武器(海明威自传性的长篇小说,入选美国现代文库 “二十世纪百佳英文小说”)
[美]欧内斯特·海明威
大数据技术丛书:Storm分布式实时计算模式
甲骨文丛书·常识:一部政治史
[美]索菲娅·罗森菲尔德
大数据技术丛书:Storm分布式实时计算模式
流动的盛宴(海明威告别尘世的“文学回忆录”,“迷惘的一代”的文学经典)
[美]欧内斯特·海明威
大数据技术丛书:Storm分布式实时计算模式
露莉的中国茶(一杯中国茶,建立起沟通的桥梁,为孩子打开看世界的眼光)
[美]陈郁如 著,[美]廉惠媛 绘,常立 黎亮 译 青豆书坊 出品
大数据技术丛书:Storm分布式实时计算模式
狼王四部曲之二:21号狼的统治(《8号狼的崛起》重磅续集!黄石国家公园伟大的狼王21号的传奇故事!)
[美]瑞克·麦金提尔