SparkNLP自然语言处理(影印版)

SparkNLP自然语言处理(影印版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者:
2021-07
版次: 1
ISBN: 9787564195113
定价: 132.00
装帧: 平装
开本: 16开
页数: 347页
1人买过
  • 如果你想构建一款使用自然语言文本的企业级应用,但不确定从哪里着手或者该使用什么工具,这本实用指南可以助你一臂之力。Wisecube首席数据科学家Alex Thomas向软件工程师和数据科学家们展示了如何使用深度学习和Apache Spark NLP库构建可扩展的自然语言处理(Natural Language Processing,NLP)应用。
        通过具体的示例、实践和理论解释,以及在Spark处理框架上使用NLP进行的动手练习,本书将教授你从基本语言学和书写系统到情感分析和搜索引擎的一切。除此之外,你还将探究开发基于文本的应用时要特别注意的性能等问题。
        在本书的四个部分中,你将学习到NLP基础知识和基本构成要素,然后再深入研究应用和系统构建:
        基础:理解自然语言处理、Apache Stark上的NLP及深度学习的基础知识。
        基本构成要素:学习包括标记化、句子分割和命名实体识别在内的NLP应用构建技术,知晓其工作方式及工作原理。
        应用:探究构建你自己的NLP应用所涉及的设计、开发和实验过程。
        构建NLP系统:考虑生产和部署NLP模型的备选方案,包括支持哪些人类语言。 亚历克斯・托马斯是Wisecube的首席数据科学家。他将自然语言处理和机器学习运用于临床数据、身份数据、雇主和求职者数据以及如今的生化数据。Alex从09版本开始使用Apache Spark,在工作中也用过包括UIMA和OpenNLP在内的多种NLP库和框架。 Preface
    Part I.  Basics
      1. Getting Started
        Introduction
        Other Tools
        Setting Up Your Environment
          Prerequisites
          Starting Apache Spark
          Checking Out the Code
        Getting Familiar with Apache Spark
          Starting Apache Spark with Spark NLP
          Loading and Viewing Data in Apache Spark
        Hello World with Spark NLP
      2. Natural Language Basics
        What Is Natural Language?
          Origins of Language
          Spoken Language Versus Written Language
        Linguistics
          Phonetics and Phonology
          Morphology
          Syntax
          Semantics
        Sociolinguistics: Dialects, Registers, and Other Varieties
          Formality
          Context
        Pragmatics
          Roman ]akobson
          How To Use Pragmatics
        Writing Systems
          Origins
          Alphabets
          Abiads
          Abugidas
          Syllabaries
          Logographs
        Encodings
          ASCII
          Unicode
          UTF-8
        Exercises: Tokenizing
          Tokenize English
          Tokenize Greek
          Tokenize Ge\'ez (Amharic)
        Resources
      3. NLP on Apache Spark
        Parallelism, Concurrency, Distributing Computation
          Parallelization Before Apache Hadoop
          MapReduce and Apache Hadoop
          Apache Spark
        Architecture of Apache Spark
          Physical Architecture
          Logical Architecture
        Spark SQL and Spark MLlib
          Transformers
          Estimators and Models
          Evaluators
        NLP Libraries
          Functionality Libraries
          Annotation Libraries
          NLP in Other Libraries
        Spark NLP
          Annotation Library
          Stages
          Pretrained Pipelines
          Finisher
          Exercises: Build a Topic Model
          Resources
      4. Deep Learning Basics
        Gradient Descent
        Backpropagation
        Convolutional Neural Networks
          Filters
          Pooling
        Recurrent Neural Networks
          Backpropagation Through Time
          Elman Nets
          LSTMs
      Exercise 1
      Exercise 2
      Resources
     Part II.  Building Blocks
      5. Processing Words
      6. Information Retrieval
      7. Classification and Regression
      8. Sequence Modeling with Keras
      9. Information Extraction
      10. Topic Modeling
      11. Word Embeddings
    Part III.  Applications
      12. Sentiment Analysis and Emotion Detection
      13. Building Knowledqe Bases
      14. Search Engine
      15. Chatbot
      16. Object Character Recognition
    Part IV.  Building NLP Systems
      17. Supporting Multiple Languages
      18. Human Labeling
      19. Productionizing NLP Applications
    Glossary
    Index
  • 内容简介:
    如果你想构建一款使用自然语言文本的企业级应用,但不确定从哪里着手或者该使用什么工具,这本实用指南可以助你一臂之力。Wisecube首席数据科学家Alex Thomas向软件工程师和数据科学家们展示了如何使用深度学习和Apache Spark NLP库构建可扩展的自然语言处理(Natural Language Processing,NLP)应用。
        通过具体的示例、实践和理论解释,以及在Spark处理框架上使用NLP进行的动手练习,本书将教授你从基本语言学和书写系统到情感分析和搜索引擎的一切。除此之外,你还将探究开发基于文本的应用时要特别注意的性能等问题。
        在本书的四个部分中,你将学习到NLP基础知识和基本构成要素,然后再深入研究应用和系统构建:
        基础:理解自然语言处理、Apache Stark上的NLP及深度学习的基础知识。
        基本构成要素:学习包括标记化、句子分割和命名实体识别在内的NLP应用构建技术,知晓其工作方式及工作原理。
        应用:探究构建你自己的NLP应用所涉及的设计、开发和实验过程。
        构建NLP系统:考虑生产和部署NLP模型的备选方案,包括支持哪些人类语言。
  • 作者简介:
    亚历克斯・托马斯是Wisecube的首席数据科学家。他将自然语言处理和机器学习运用于临床数据、身份数据、雇主和求职者数据以及如今的生化数据。Alex从09版本开始使用Apache Spark,在工作中也用过包括UIMA和OpenNLP在内的多种NLP库和框架。
  • 目录:
    Preface
    Part I.  Basics
      1. Getting Started
        Introduction
        Other Tools
        Setting Up Your Environment
          Prerequisites
          Starting Apache Spark
          Checking Out the Code
        Getting Familiar with Apache Spark
          Starting Apache Spark with Spark NLP
          Loading and Viewing Data in Apache Spark
        Hello World with Spark NLP
      2. Natural Language Basics
        What Is Natural Language?
          Origins of Language
          Spoken Language Versus Written Language
        Linguistics
          Phonetics and Phonology
          Morphology
          Syntax
          Semantics
        Sociolinguistics: Dialects, Registers, and Other Varieties
          Formality
          Context
        Pragmatics
          Roman ]akobson
          How To Use Pragmatics
        Writing Systems
          Origins
          Alphabets
          Abiads
          Abugidas
          Syllabaries
          Logographs
        Encodings
          ASCII
          Unicode
          UTF-8
        Exercises: Tokenizing
          Tokenize English
          Tokenize Greek
          Tokenize Ge\'ez (Amharic)
        Resources
      3. NLP on Apache Spark
        Parallelism, Concurrency, Distributing Computation
          Parallelization Before Apache Hadoop
          MapReduce and Apache Hadoop
          Apache Spark
        Architecture of Apache Spark
          Physical Architecture
          Logical Architecture
        Spark SQL and Spark MLlib
          Transformers
          Estimators and Models
          Evaluators
        NLP Libraries
          Functionality Libraries
          Annotation Libraries
          NLP in Other Libraries
        Spark NLP
          Annotation Library
          Stages
          Pretrained Pipelines
          Finisher
          Exercises: Build a Topic Model
          Resources
      4. Deep Learning Basics
        Gradient Descent
        Backpropagation
        Convolutional Neural Networks
          Filters
          Pooling
        Recurrent Neural Networks
          Backpropagation Through Time
          Elman Nets
          LSTMs
      Exercise 1
      Exercise 2
      Resources
     Part II.  Building Blocks
      5. Processing Words
      6. Information Retrieval
      7. Classification and Regression
      8. Sequence Modeling with Keras
      9. Information Extraction
      10. Topic Modeling
      11. Word Embeddings
    Part III.  Applications
      12. Sentiment Analysis and Emotion Detection
      13. Building Knowledqe Bases
      14. Search Engine
      15. Chatbot
      16. Object Character Recognition
    Part IV.  Building NLP Systems
      17. Supporting Multiple Languages
      18. Human Labeling
      19. Productionizing NLP Applications
    Glossary
    Index
查看详情
相关图书 / 更多
SparkNLP自然语言处理(影印版)
Spring Framework6开发实战 Spring+Spring Web MVC+MyBatis
肖海鹏、耿卫江、王荣芝、张天怡、张志慧
SparkNLP自然语言处理(影印版)
Spark大数据分析
作者
SparkNLP自然语言处理(影印版)
Spark入门与大数据分析实战
迟殿委 李超
SparkNLP自然语言处理(影印版)
Spark大数据开发(职业教育计算机系列教材)
唐春玲;周桥;陈小龙
SparkNLP自然语言处理(影印版)
Spring Boot+Vue前后端分离项目全栈开发实战
唐文
SparkNLP自然语言处理(影印版)
Spring快速入门到精通
明日科技 编著
SparkNLP自然语言处理(影印版)
Spring Boot 3.0开发实战
李西明;陈立为
SparkNLP自然语言处理(影印版)
Spark分布式处理实战
刘均 王璐烽
SparkNLP自然语言处理(影印版)
Spring Security原理与实战:构建安全可靠的微服务
邹炎
SparkNLP自然语言处理(影印版)
Spark原理深入与编程实战(微课视频版)
辛立伟;张帆;张会娟
SparkNLP自然语言处理(影印版)
Spring Cloud Alibaba大型微服务架构项目实战(上册)
十三 著
SparkNLP自然语言处理(影印版)
Spring Boot 3 +Vue 3开发实战
朱建昕
您可能感兴趣 / 更多
SparkNLP自然语言处理(影印版)
TensorFlow机器学习实用指南
Alexia;Audevart
SparkNLP自然语言处理(影印版)
Python技术手册 第4版(影印版)
Alex Martelli
SparkNLP自然语言处理(影印版)
城市环境教育概论
Alex Russ Marianne 著
SparkNLP自然语言处理(影印版)
牛津阅读手册
Alexander Pollatsek
SparkNLP自然语言处理(影印版)
汗青堂丛书084·查理大帝
Alessandro、Barbero 著
SparkNLP自然语言处理(影印版)
代数几何学原理III.凝聚层的上同调
Alexander、Grothe 著
SparkNLP自然语言处理(影印版)
人工智能在网络安全中的应用
AlessandroParisi
SparkNLP自然语言处理(影印版)
大数据湖最佳实践
Alex、Gorelik 著
SparkNLP自然语言处理(影印版)
分子生物学(第四版导读版)
Alexander McLennan、Andy Bates、Phil Turner、Mike White 编
SparkNLP自然语言处理(影印版)
Python编程基础(视频讲解版)
Alex、武沛齐、王战山 著
SparkNLP自然语言处理(影印版)
外观设计保护:德国、欧盟、美国、日本、中国与韩国的法规与实践(原书第4版)
Alexander、Bulling、Angelika、Langöhrig 著
SparkNLP自然语言处理(影印版)
代数几何学原理II.几类态射的整体性质
Alexander、Grothe 著