流式架构:Kafka与MapR Streams数据流处理

流式架构:Kafka与MapR Streams数据流处理
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2017-06
版次: 1
ISBN: 9787121317224
定价: 55.00
装帧: 平装
开本: 16开
纸张: 轻型纸
页数: 140页
字数: 101千字
正文语种: 简体中文
33人买过
  •    所有连续的事件流都可以称为数据流。对连续数据流设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。本书以Apache Kafka 和MapRStreams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前*符合流式设计需求的消息传递和流分析工具,适合架构师、大数据科学家及IT工程师阅读。   TedDunning,MapRTechnologies首席应用架构师,开源社区的活跃成员。现任ApacheFoundation孵化器的VP,是大量项目的冠军得主和导师,也是ApacheZooKeeper和Drill项目的贡献者和PMC成员。 
      EllenFriedman,解决方案咨询师,著名演讲者和作家,目前主要撰写大数据方面的著作。她是ApacheDrill和ApacheMahout项目的贡献者。 
      译者简介 
      唐李洋,博士,研究方向为云计算、并行计算、数据挖掘与分析等。曾经在Cisco从事过数据架构方面的设计与分析工作。 

    目录 
    第1 章 为什么使用流 1 
    飞机、火车和汽车:车联网和物联网  3 
    流数据:这才是现实世界  6 
    什么时候需要流  8 
    不止是实时:流架构的更多优势  11 
    流架构的最佳实践  13 
    医疗数据流案例  14 
    流数据:架构设计的核心  17 
      
    第2 章 流式架构  19 
    狭义视角:实时应用  20 
    通用流式架构的关键问题  21 
    消息传递技术的重要性 24 
    实时分析工具  28 
    Apache Storm  30 
    Apache Spark Streaming  31 
    Apache Flink  32 
    Apache Apex  33 
    流分析功能比较  33 
    小结  36 
      
    第3 章 流架构:微服务的理想平台  37 
    为什么需要微服务  38 
    微服务需要哪些支撑 41 
    关于微服务的更多详情  42 
    设计流架构:以在线视频服务为例  45 
    新设计:支持消息传递的基础设施  47 
    通用微架构的重要性 49 
    命名问题  50 
    为什么使用分布式文件和NoSQL 数据库  52 
    视频服务的新设计  52 
    小结:综合平台视角 54 
      
    第4 章 使用Kafka 进行流传输  57 
    Kafka 的动机  57 
    Kafka 的创新  58 
    Kafka 的基本概念  60 
    排序  61 
    持久化  62 
    Kafka API 62 
    KafkaProducer API  63 
    KafkaConsumer API  66 
    遗留API  70 
    Kafka 实用程序  71 
    负载均衡  71 
    镜像  72 
    Kafka 的陷阱  73 
    产品环境下的Kafka  73 
    主题和分区的数目有限  74 
    手动均衡分区负载  75 
    没有固有的序列化机制  76 
    镜像的不足  77 
    小结  78 
      
    第5 章 MapR Streams  79 
    MapR Streams 的创新  79 
    MapR 流系统的历史和情境  82 
    MapR Streams 的工作原理  84 
    配置MapR Streams  86 
    地理分布式复制  89 
    MapR Streams 的陷阱  91 
      
    第6 章 基于流数据的欺诈检测 ..93 
    刷卡速度  94 
    快速响应决策:“这是欺诈吗”  95 
    多用途流数据  98 
    欺诈检测器的向上扩展  99 
    小结  101 
      
    第7 章 地理分布式数据流  103 
    利益相关者  104 
    设计目标  106 
    设计选择  106 
    我们的设计  108 
    数据  108 
    控制谁能访问流数据  109 
    基于流的地理分布式复制的优势 .110 
      
    第8 章 总结  113 
    流式架构的优势  115 
    过渡到流架构  116 
    小结  119 
    附录A 附加资源  121 
    作者简介  125
  • 内容简介:
       所有连续的事件流都可以称为数据流。对连续数据流设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。本书以Apache Kafka 和MapRStreams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前*符合流式设计需求的消息传递和流分析工具,适合架构师、大数据科学家及IT工程师阅读。
  • 作者简介:
      TedDunning,MapRTechnologies首席应用架构师,开源社区的活跃成员。现任ApacheFoundation孵化器的VP,是大量项目的冠军得主和导师,也是ApacheZooKeeper和Drill项目的贡献者和PMC成员。 
      EllenFriedman,解决方案咨询师,著名演讲者和作家,目前主要撰写大数据方面的著作。她是ApacheDrill和ApacheMahout项目的贡献者。 
      译者简介 
      唐李洋,博士,研究方向为云计算、并行计算、数据挖掘与分析等。曾经在Cisco从事过数据架构方面的设计与分析工作。 

  • 目录:
    目录 
    第1 章 为什么使用流 1 
    飞机、火车和汽车:车联网和物联网  3 
    流数据:这才是现实世界  6 
    什么时候需要流  8 
    不止是实时:流架构的更多优势  11 
    流架构的最佳实践  13 
    医疗数据流案例  14 
    流数据:架构设计的核心  17 
      
    第2 章 流式架构  19 
    狭义视角:实时应用  20 
    通用流式架构的关键问题  21 
    消息传递技术的重要性 24 
    实时分析工具  28 
    Apache Storm  30 
    Apache Spark Streaming  31 
    Apache Flink  32 
    Apache Apex  33 
    流分析功能比较  33 
    小结  36 
      
    第3 章 流架构:微服务的理想平台  37 
    为什么需要微服务  38 
    微服务需要哪些支撑 41 
    关于微服务的更多详情  42 
    设计流架构:以在线视频服务为例  45 
    新设计:支持消息传递的基础设施  47 
    通用微架构的重要性 49 
    命名问题  50 
    为什么使用分布式文件和NoSQL 数据库  52 
    视频服务的新设计  52 
    小结:综合平台视角 54 
      
    第4 章 使用Kafka 进行流传输  57 
    Kafka 的动机  57 
    Kafka 的创新  58 
    Kafka 的基本概念  60 
    排序  61 
    持久化  62 
    Kafka API 62 
    KafkaProducer API  63 
    KafkaConsumer API  66 
    遗留API  70 
    Kafka 实用程序  71 
    负载均衡  71 
    镜像  72 
    Kafka 的陷阱  73 
    产品环境下的Kafka  73 
    主题和分区的数目有限  74 
    手动均衡分区负载  75 
    没有固有的序列化机制  76 
    镜像的不足  77 
    小结  78 
      
    第5 章 MapR Streams  79 
    MapR Streams 的创新  79 
    MapR 流系统的历史和情境  82 
    MapR Streams 的工作原理  84 
    配置MapR Streams  86 
    地理分布式复制  89 
    MapR Streams 的陷阱  91 
      
    第6 章 基于流数据的欺诈检测 ..93 
    刷卡速度  94 
    快速响应决策:“这是欺诈吗”  95 
    多用途流数据  98 
    欺诈检测器的向上扩展  99 
    小结  101 
      
    第7 章 地理分布式数据流  103 
    利益相关者  104 
    设计目标  106 
    设计选择  106 
    我们的设计  108 
    数据  108 
    控制谁能访问流数据  109 
    基于流的地理分布式复制的优势 .110 
      
    第8 章 总结  113 
    流式架构的优势  115 
    过渡到流架构  116 
    小结  119 
    附录A 附加资源  121 
    作者简介  125
查看详情
12
相关图书 / 更多
流式架构:Kafka与MapR Streams数据流处理
流式系统(影印版)
Tyler Akidau, Slava Chernyak, Reuven Lax
流式架构:Kafka与MapR Streams数据流处理
流式细胞术入门及平台化管理
李妍 编著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术原理与科研应用简明手册
[瑞士]瑞菲尔·努纳兹 著;刘秉兹、许增禄 译
流式架构:Kafka与MapR Streams数据流处理
流式细胞术:原理、操作及应用(第2版)
陈朱波、曹雪涛 著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术
杜立颖、冯仁青 著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术
贾永蕊 著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术原理与应用教程
吴后男 编
流式架构:Kafka与MapR Streams数据流处理
流式细胞分析技术及应用
刘鑫 著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术:原理、操作及应用
陈朱波、曹雪涛 著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术临床应用
吴丽娟
流式架构:Kafka与MapR Streams数据流处理
流式细胞术——从基础研究到临床医学应用
梁智辉、胡豫 著
流式架构:Kafka与MapR Streams数据流处理
流式细胞术操作规范
[美]Teresa、Robert G.Hawley 著;邵启祥 译