大数据智能:互联网时代的机器学习和自然语言处理技术

大数据智能:互联网时代的机器学习和自然语言处理技术
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: ,
2016-01
版次: 1
ISBN: 9787121276484
定价: 49.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 232页
字数: 322千字
正文语种: 简体中文
81人买过
  •   《大数据智能互联网时代的机器学习和自然语言处理技术》是一本介绍大数据智能分析的科普书籍,旨在让更多的人了解和学习互联网时代的机器学习和自然语言处理技术,以期让大数据技术更好地为我们的生产和生活服务。
      《大数据智能互联网时代的机器学习和自然语言处理技术》包括大数据智能基础和大数据智能应用两个部分,共8章。大数据智能基础部分有三章:第1章以深度学习为例介绍大数据智能的计算框架;第2章以知识图谱为例介绍大数据智能的知识库;第3章介绍大数据的计算处理系统。大数据智能应用部分有5章:第4章介绍智能问答,第5章介绍主题模型,第6章介绍个性化推荐,第7章介绍情感分析与意见挖掘,第8章介绍面向社会媒体内容的分析与应用。最后在《大数据智能——互联网时代的机器学习和自然语言处理技术》的后记部分为读者追踪大数据智能的学术材料提供了建议。
      《大数据智能互联网时代的机器学习和自然语言处理技术》适合作为高等院校计算机相关专业的研究生学习参考资料,也适合电脑爱好者阅读。作者特别希望本书能够帮助所有愿意对大数据技术有所了解,以及想要将大数据技术应用于本职工作的读者。
      刘知远,目前以项目负责人身份主持NSFC青年基金、博士后科学基金等多项研究项目,科研经费累计超过50万元。同时以项目骨干身份参与实验室多项973、863、NSFC重点和面上项目。承担和参与项目列表如下:担任项目负责人的项目1.2014年-2016年,国家社会科学基金重大项目“基于大规模社交媒体的汉语模因传播机理量化研究”子课题。2.2013年-2015年,NSFC青年基金项目“基于协同语义计算的社交媒体信息扩散与可信性研究”。3.2013年-2014年,清华大学-微软联合实验室研究项目“EfficientChineseEntityLinkingforLarge-scaleWebCorpustoHeterogeneousEntityNetworks”。担任项目骨干的项目1.2014年-2018年,973项目“面向三元空间的互联网中文信息处理理论与方法”。2.2012年-2015年,NSFC面上项目“关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究”。3.2012年-2016年,NSFC重点项目“篇章级中文语义分析理论与方法”。4.2009年-2011年,NSFC面上项目“汉语复杂网络的性质、结构、演化及其典型应用研究”。5.2007年-2009年,863项目“大规模网络图文数据的语义分类和适度理解技术研究”。+6.2011年-2013年,东芝公司研究项目“面向中文文档分类的技术研发”。7.2011年-2012年,Google公司研究项目“移动查询助理和查询结果摘要”。8.2010年-2011年,Google公司研究项目“信息标注与社区发现的大规模算法研究”。9.2009年-2011年,Google公司研究项目“针对流文本集的并行LDA”。 第1章深度学习――机器大脑的结构1
    1.1概述3
    1.1.1可以做酸奶的面包机――通用机器的概念3
    1.1.2连接主义5
    1.1.3用机器设计机器6
    1.1.4深度网络6
    1.1.5深度学习的用武之地7
    1.2从人脑神经元到人工神经元8
    1.2.1生物神经元中的计算灵感8
    1.2.2激活函数9
    1.3参数学习10
    1.3.1模型的评价11
    1.3.2有监督学习11
    1.3.3梯度下降法12
    1.4多层前馈网络13
    1.4.1多层前馈网络14
    1.4.2后向传播算法计算梯度16
    1.5逐层预训练17
    1.6深度学习是终极神器吗19
    1.6.1深度学习带来了什么19
    1.6.2深度学习尚未做到什么20
    1.7内容回顾与推荐阅读21
    XII目录
    1.8参考文献21
    第2章知识图谱――机器大脑中的知识库23
    2.1什么是知识图谱25
    2.2知识图谱的构建27
    2.2.1大规模知识库27
    2.2.2互联网链接数据28
    2.2.3互联网网页文本数据29
    2.2.4多数据源的知识融合29
    2.3知识图谱的典型应用30
    2.3.1查询理解(QueryUnderstanding)30
    2.3.2自动问答(QuestionAnswering)32
    2.3.3文档表示(DocumentRepresentation)33
    2.4知识图谱的主要技术34
    2.4.1实体链指(EntityLinking)34
    2.4.2关系抽取(RelationExtraction)35
    2.4.3知识推理(KnowledgeReasoning)37
    2.4.4知识表示(KnowledgeRepresentation)38
    2.5前景与挑战39
    2.6内容回顾与推荐阅读40
    2.7参考文献41
    第3章大数据系统――大数据背后的支撑技术43
    3.1概述45
    3.2高性能计算技术46
    3.2.1超级计算机的组成47
    3.2.2并行计算的系统支持48
    3.3虚拟化和云计算技术52
    3.3.1虚拟化技术52
    目录XIII
    3.3.2云计算服务54
    3.4基于分布式计算的大数据系统55
    3.4.1Hadoop生态系统55
    3.4.2Spark61
    3.4.3典型的大数据基础架构63
    3.5大规模图计算63
    3.5.1分布式图计算框架64
    3.5.2高效的单机图计算框架65
    3.6NoSQL66
    3.6.1MongoDB简介67
    3.7内容回顾与推荐阅读69
    3.8参考文献70
    第4章智能问答――智能助手是如何炼成的71
    4.1概述73
    4.2问答系统的主要组成77
    4.3文本问答系统78
    4.3.1问题理解78
    4.3.2知识检索81
    4.3.3答案生成83
    4.4社区问答系统84
    4.4.1社区问答系统的结构85
    4.4.2相似问题检索86
    4.4.3答案过滤86
    4.5多媒体问答系统87
    4.6大型问答系统案例:IBM沃森问答系统89
    4.6.1沃森的总体结构89
    4.6.2问题解析90
    4.6.3知识储备90
    XIV目录
    4.6.4检索和候选答案生成91
    4.6.5可信答案确定92
    4.7内容回顾与推荐阅读93
    4.8参考文献94
    第5章主题模型――机器的智能摘要利器97
    5.1概述99
    5.2主题模型出现的背景100
    5.3第一个主题模型潜在语义分析102
    5.4第一个正式的概率主题模型104
    5.5第一个正式的贝叶斯主题模型105
    5.6LDA的概要介绍106
    5.6.1LDA的延伸理解――主题模型广义理解109
    5.6.2模型求解111
    5.6.3模型评估112
    5.6.4模型选择:主题数目的确定113
    5.7主题模型的变形与应用114
    5.7.1基于LDA的模型变种114
    5.7.2基于LDA的典型应用115
    5.7.3一个基于主题模型的新浪名人话题排行榜应用118
    5.8内容回顾与推荐阅读122
    5.9参考文献123
    第6章个性化推荐系统――如何了解电脑背后的TA129
    6.1概述131
    6.1.1推荐系统的发展历史132
    6.1.2推荐无处不在133
    6.1.3从千人一面到千人千面133
    6.2个性化推荐的基本问题134
    6.2.1推荐系统的输入135
    目录XV
    6.2.2推荐系统的输出137
    6.2.3个性化推荐的形式化137
    6.2.4推荐系统的三大核心问题138
    6.3典型推荐算法浅析139
    6.3.1推荐算法的分类139
    6.3.2典型推荐算法介绍140
    6.3.3基于矩阵分解的打分预测146
    6.3.4推荐的可解释性151
    6.3.5推荐算法的评价153
    6.3.6我们走了多远156
    6.4参考文献160
    第7章情感分析与意见挖掘――计算机如何了解人类情感165
    7.1概述167
    7.2情感分析的主要研究问题172
    7.3情感分析的主要方法175
    7.3.1构成情感和观点的基本元素175
    7.3.2情感极性与情感词典177
    7.3.3属性-观点对182
    7.3.4情感分析184
    7.4主要的情感词典资源188
    7.5内容回顾与推荐阅读189
    7.6参考文献190
    第8章面向社会媒体大数据的语言使用分析及应用195
    8.1概述197
    8.2面向社会媒体的自然语言使用分析197
    8.2.1词汇的时空传播与演化198
    8.2.2语言使用与个体差异200
    XVI目录
    8.2.3语言使用与社会地位202
    8.2.4语言使用与群体分析203
    8.3面向社会媒体的自然语言分析应用206
    8.3.1社会预测206
    8.3.2霸凌现象定量分析207
    8.4未来研究的挑战与展望208
    8.5参考文献209
    后记214
    国际学术组织、学术会议与学术论文214
    国内学术组织、学术会议与学术论文216
    如何快速了解某个领域的研究进展217
  • 内容简介:
      《大数据智能互联网时代的机器学习和自然语言处理技术》是一本介绍大数据智能分析的科普书籍,旨在让更多的人了解和学习互联网时代的机器学习和自然语言处理技术,以期让大数据技术更好地为我们的生产和生活服务。
      《大数据智能互联网时代的机器学习和自然语言处理技术》包括大数据智能基础和大数据智能应用两个部分,共8章。大数据智能基础部分有三章:第1章以深度学习为例介绍大数据智能的计算框架;第2章以知识图谱为例介绍大数据智能的知识库;第3章介绍大数据的计算处理系统。大数据智能应用部分有5章:第4章介绍智能问答,第5章介绍主题模型,第6章介绍个性化推荐,第7章介绍情感分析与意见挖掘,第8章介绍面向社会媒体内容的分析与应用。最后在《大数据智能——互联网时代的机器学习和自然语言处理技术》的后记部分为读者追踪大数据智能的学术材料提供了建议。
      《大数据智能互联网时代的机器学习和自然语言处理技术》适合作为高等院校计算机相关专业的研究生学习参考资料,也适合电脑爱好者阅读。作者特别希望本书能够帮助所有愿意对大数据技术有所了解,以及想要将大数据技术应用于本职工作的读者。
  • 作者简介:
      刘知远,目前以项目负责人身份主持NSFC青年基金、博士后科学基金等多项研究项目,科研经费累计超过50万元。同时以项目骨干身份参与实验室多项973、863、NSFC重点和面上项目。承担和参与项目列表如下:担任项目负责人的项目1.2014年-2016年,国家社会科学基金重大项目“基于大规模社交媒体的汉语模因传播机理量化研究”子课题。2.2013年-2015年,NSFC青年基金项目“基于协同语义计算的社交媒体信息扩散与可信性研究”。3.2013年-2014年,清华大学-微软联合实验室研究项目“EfficientChineseEntityLinkingforLarge-scaleWebCorpustoHeterogeneousEntityNetworks”。担任项目骨干的项目1.2014年-2018年,973项目“面向三元空间的互联网中文信息处理理论与方法”。2.2012年-2015年,NSFC面上项目“关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究”。3.2012年-2016年,NSFC重点项目“篇章级中文语义分析理论与方法”。4.2009年-2011年,NSFC面上项目“汉语复杂网络的性质、结构、演化及其典型应用研究”。5.2007年-2009年,863项目“大规模网络图文数据的语义分类和适度理解技术研究”。+6.2011年-2013年,东芝公司研究项目“面向中文文档分类的技术研发”。7.2011年-2012年,Google公司研究项目“移动查询助理和查询结果摘要”。8.2010年-2011年,Google公司研究项目“信息标注与社区发现的大规模算法研究”。9.2009年-2011年,Google公司研究项目“针对流文本集的并行LDA”。
  • 目录:
    第1章深度学习――机器大脑的结构1
    1.1概述3
    1.1.1可以做酸奶的面包机――通用机器的概念3
    1.1.2连接主义5
    1.1.3用机器设计机器6
    1.1.4深度网络6
    1.1.5深度学习的用武之地7
    1.2从人脑神经元到人工神经元8
    1.2.1生物神经元中的计算灵感8
    1.2.2激活函数9
    1.3参数学习10
    1.3.1模型的评价11
    1.3.2有监督学习11
    1.3.3梯度下降法12
    1.4多层前馈网络13
    1.4.1多层前馈网络14
    1.4.2后向传播算法计算梯度16
    1.5逐层预训练17
    1.6深度学习是终极神器吗19
    1.6.1深度学习带来了什么19
    1.6.2深度学习尚未做到什么20
    1.7内容回顾与推荐阅读21
    XII目录
    1.8参考文献21
    第2章知识图谱――机器大脑中的知识库23
    2.1什么是知识图谱25
    2.2知识图谱的构建27
    2.2.1大规模知识库27
    2.2.2互联网链接数据28
    2.2.3互联网网页文本数据29
    2.2.4多数据源的知识融合29
    2.3知识图谱的典型应用30
    2.3.1查询理解(QueryUnderstanding)30
    2.3.2自动问答(QuestionAnswering)32
    2.3.3文档表示(DocumentRepresentation)33
    2.4知识图谱的主要技术34
    2.4.1实体链指(EntityLinking)34
    2.4.2关系抽取(RelationExtraction)35
    2.4.3知识推理(KnowledgeReasoning)37
    2.4.4知识表示(KnowledgeRepresentation)38
    2.5前景与挑战39
    2.6内容回顾与推荐阅读40
    2.7参考文献41
    第3章大数据系统――大数据背后的支撑技术43
    3.1概述45
    3.2高性能计算技术46
    3.2.1超级计算机的组成47
    3.2.2并行计算的系统支持48
    3.3虚拟化和云计算技术52
    3.3.1虚拟化技术52
    目录XIII
    3.3.2云计算服务54
    3.4基于分布式计算的大数据系统55
    3.4.1Hadoop生态系统55
    3.4.2Spark61
    3.4.3典型的大数据基础架构63
    3.5大规模图计算63
    3.5.1分布式图计算框架64
    3.5.2高效的单机图计算框架65
    3.6NoSQL66
    3.6.1MongoDB简介67
    3.7内容回顾与推荐阅读69
    3.8参考文献70
    第4章智能问答――智能助手是如何炼成的71
    4.1概述73
    4.2问答系统的主要组成77
    4.3文本问答系统78
    4.3.1问题理解78
    4.3.2知识检索81
    4.3.3答案生成83
    4.4社区问答系统84
    4.4.1社区问答系统的结构85
    4.4.2相似问题检索86
    4.4.3答案过滤86
    4.5多媒体问答系统87
    4.6大型问答系统案例:IBM沃森问答系统89
    4.6.1沃森的总体结构89
    4.6.2问题解析90
    4.6.3知识储备90
    XIV目录
    4.6.4检索和候选答案生成91
    4.6.5可信答案确定92
    4.7内容回顾与推荐阅读93
    4.8参考文献94
    第5章主题模型――机器的智能摘要利器97
    5.1概述99
    5.2主题模型出现的背景100
    5.3第一个主题模型潜在语义分析102
    5.4第一个正式的概率主题模型104
    5.5第一个正式的贝叶斯主题模型105
    5.6LDA的概要介绍106
    5.6.1LDA的延伸理解――主题模型广义理解109
    5.6.2模型求解111
    5.6.3模型评估112
    5.6.4模型选择:主题数目的确定113
    5.7主题模型的变形与应用114
    5.7.1基于LDA的模型变种114
    5.7.2基于LDA的典型应用115
    5.7.3一个基于主题模型的新浪名人话题排行榜应用118
    5.8内容回顾与推荐阅读122
    5.9参考文献123
    第6章个性化推荐系统――如何了解电脑背后的TA129
    6.1概述131
    6.1.1推荐系统的发展历史132
    6.1.2推荐无处不在133
    6.1.3从千人一面到千人千面133
    6.2个性化推荐的基本问题134
    6.2.1推荐系统的输入135
    目录XV
    6.2.2推荐系统的输出137
    6.2.3个性化推荐的形式化137
    6.2.4推荐系统的三大核心问题138
    6.3典型推荐算法浅析139
    6.3.1推荐算法的分类139
    6.3.2典型推荐算法介绍140
    6.3.3基于矩阵分解的打分预测146
    6.3.4推荐的可解释性151
    6.3.5推荐算法的评价153
    6.3.6我们走了多远156
    6.4参考文献160
    第7章情感分析与意见挖掘――计算机如何了解人类情感165
    7.1概述167
    7.2情感分析的主要研究问题172
    7.3情感分析的主要方法175
    7.3.1构成情感和观点的基本元素175
    7.3.2情感极性与情感词典177
    7.3.3属性-观点对182
    7.3.4情感分析184
    7.4主要的情感词典资源188
    7.5内容回顾与推荐阅读189
    7.6参考文献190
    第8章面向社会媒体大数据的语言使用分析及应用195
    8.1概述197
    8.2面向社会媒体的自然语言使用分析197
    8.2.1词汇的时空传播与演化198
    8.2.2语言使用与个体差异200
    XVI目录
    8.2.3语言使用与社会地位202
    8.2.4语言使用与群体分析203
    8.3面向社会媒体的自然语言分析应用206
    8.3.1社会预测206
    8.3.2霸凌现象定量分析207
    8.4未来研究的挑战与展望208
    8.5参考文献209
    后记214
    国际学术组织、学术会议与学术论文214
    国内学术组织、学术会议与学术论文216
    如何快速了解某个领域的研究进展217
查看详情
您可能感兴趣 / 更多
大数据智能:互联网时代的机器学习和自然语言处理技术
图神经网络导论
刘知远 周界
大数据智能:互联网时代的机器学习和自然语言处理技术
知识图谱与深度学习(新时代·技术新未来)
刘知远、韩旭、孙茂松 著
大数据智能:互联网时代的机器学习和自然语言处理技术
大数据智能:数据驱动的自然语言处理技术
刘知远、崔安颀 著