文本分析与文本挖掘
出版时间:
2018-12
版次:
1
ISBN:
9787030591203
定价:
110.00
装帧:
平装
开本:
16开
页数:
244页
字数:
300千字
正文语种:
简体中文
32人买过
-
《文本分析与文本挖掘》阐述词法分析、文本分类、文本聚类、文本检索、垃圾邮件过滤、情感分析、个性化推荐等文本分析与文本挖掘方面的理论方法。人工智能技术与互联网的发展更是为该领域研究提出新的需求,《文本分析与文本挖掘》相关理论和技术可以直接用于解决具体文本分析与文本挖掘的问题,也可以为进一步研究提供理论方法基础。《文本分析与文本挖掘》包括理论、技术,既适合理论方法的学习,又适合工程实践。《文本分析与文本挖掘》配套软件、更多案例、技术文档、配套PPT课件等请登录和查询。 目录
第1章 统计中文分词技术 1
1.1 词法分析问题 1
1.2 词典与基于规则分词 4
1.3 仿词识别与最少分词技术 7
1.4 基于词网格的N-gram统计分词技术 11
1.5 数据平滑与专业词抽取 18
1.6 本章小结 25
第2章 词性标注与序列标注 27
2.1 三个序列标注问题 27
2.2 隐马尔可夫序列标注 31
2.3 CRF模型与序列标注 39
2.4 CRF中文词性标注 43
2.5 组合分类器的序列标注方法 46
2.6 实验结果与分析 52
2.7 本章小结 56
第3章 命名实体识别 58
3.1 中文命名实体识别特点与任务描述 58
3.2 ME模型及其适用性 60
3.3 基于ME模型的中文命名实体识别 64
3.4 双层混合模型方法研究 70
3.5 实验结果与分析 74
3.6 本章小结 78
第4章 文本分类技术 80
4.1 文本的向量空间模型 80
4.2 文本相似度与kNN分类 85
4.3 朴素贝叶斯文本分类 93
4.4 朴素贝叶斯分类中的特征缺失补偿策略 96
4.5 基于SVM的文本分类 102
4.6 基于分类技术的歧义消解问题 107
4.7 本章小结 112
第5章 文本聚类技术 114
5.1 聚类方法与文本聚类问题 114
5.2 k-均值与k-中心点文本聚类方法 119
5.3 文本层次聚类方法 124
5.4 基于聚类技术的词义分析 126
5.5 其他聚类方法 130
5.6 本章小结 133
第6章 文本检索技术 135
6.1 Web检索系统构成与文本检索的评价 135
6.2 信息检索模型与布尔模型 138
6.3 向量空间模型与相关性反馈检索模型 140
6.4 扩展的布尔模型与概率模型 145
6.5 信息检索与信息过滤及信息推荐的关系 149
6.6 本章小结 153
第7章 垃圾邮件过滤与情感分析 155
7.1 垃圾邮件过滤问题与框架 155
7.2 朴素贝叶斯垃圾邮件过滤方法 159
7.3 ME模型与SVM垃圾邮件过滤方法 162
7.4 情感分析问题 167
7.5 情感分析方法 172
7.6 本章小结 181
第8章 个性化协同过滤推荐技术 183
8.1 推荐问题提出 183
8.2 通用推荐与个性化推荐 188
8.3 基本协同过滤推荐方法 192
8.4 基于SVD的协同过滤推荐 200
8.5 改进协同过滤推荐方法 207
8.6 本章小结 214
第8第9章 组合推荐技术 215
9.1 基于内容的推荐技术 215
9.2 基于分类技术的推荐方法 219
9.3 基于推理的推荐技术 230
9.4 混合推荐方法 238
9.5 本章小结 242
参考文献 243
-
内容简介:
《文本分析与文本挖掘》阐述词法分析、文本分类、文本聚类、文本检索、垃圾邮件过滤、情感分析、个性化推荐等文本分析与文本挖掘方面的理论方法。人工智能技术与互联网的发展更是为该领域研究提出新的需求,《文本分析与文本挖掘》相关理论和技术可以直接用于解决具体文本分析与文本挖掘的问题,也可以为进一步研究提供理论方法基础。《文本分析与文本挖掘》包括理论、技术,既适合理论方法的学习,又适合工程实践。《文本分析与文本挖掘》配套软件、更多案例、技术文档、配套PPT课件等请登录和查询。
-
目录:
目录
第1章 统计中文分词技术 1
1.1 词法分析问题 1
1.2 词典与基于规则分词 4
1.3 仿词识别与最少分词技术 7
1.4 基于词网格的N-gram统计分词技术 11
1.5 数据平滑与专业词抽取 18
1.6 本章小结 25
第2章 词性标注与序列标注 27
2.1 三个序列标注问题 27
2.2 隐马尔可夫序列标注 31
2.3 CRF模型与序列标注 39
2.4 CRF中文词性标注 43
2.5 组合分类器的序列标注方法 46
2.6 实验结果与分析 52
2.7 本章小结 56
第3章 命名实体识别 58
3.1 中文命名实体识别特点与任务描述 58
3.2 ME模型及其适用性 60
3.3 基于ME模型的中文命名实体识别 64
3.4 双层混合模型方法研究 70
3.5 实验结果与分析 74
3.6 本章小结 78
第4章 文本分类技术 80
4.1 文本的向量空间模型 80
4.2 文本相似度与kNN分类 85
4.3 朴素贝叶斯文本分类 93
4.4 朴素贝叶斯分类中的特征缺失补偿策略 96
4.5 基于SVM的文本分类 102
4.6 基于分类技术的歧义消解问题 107
4.7 本章小结 112
第5章 文本聚类技术 114
5.1 聚类方法与文本聚类问题 114
5.2 k-均值与k-中心点文本聚类方法 119
5.3 文本层次聚类方法 124
5.4 基于聚类技术的词义分析 126
5.5 其他聚类方法 130
5.6 本章小结 133
第6章 文本检索技术 135
6.1 Web检索系统构成与文本检索的评价 135
6.2 信息检索模型与布尔模型 138
6.3 向量空间模型与相关性反馈检索模型 140
6.4 扩展的布尔模型与概率模型 145
6.5 信息检索与信息过滤及信息推荐的关系 149
6.6 本章小结 153
第7章 垃圾邮件过滤与情感分析 155
7.1 垃圾邮件过滤问题与框架 155
7.2 朴素贝叶斯垃圾邮件过滤方法 159
7.3 ME模型与SVM垃圾邮件过滤方法 162
7.4 情感分析问题 167
7.5 情感分析方法 172
7.6 本章小结 181
第8章 个性化协同过滤推荐技术 183
8.1 推荐问题提出 183
8.2 通用推荐与个性化推荐 188
8.3 基本协同过滤推荐方法 192
8.4 基于SVD的协同过滤推荐 200
8.5 改进协同过滤推荐方法 207
8.6 本章小结 214
第8第9章 组合推荐技术 215
9.1 基于内容的推荐技术 215
9.2 基于分类技术的推荐方法 219
9.3 基于推理的推荐技术 230
9.4 混合推荐方法 238
9.5 本章小结 242
参考文献 243
查看详情
-
全新
河北省保定市
平均发货30小时
成功完成率89.29%
-
全新
河北省保定市
平均发货26小时
成功完成率90.02%
-
全新
河北省保定市
平均发货18小时
成功完成率91.43%
-
全新
山东省济宁市
平均发货52小时
成功完成率83.66%
-
全新
北京市海淀区
平均发货15小时
成功完成率87.81%
-
文本分析与文本挖掘
书籍均为精品二手图书品相85品以上,出库会经过高温消毒,书籍上架都会检测可保证正版!!
九品
天津市宝坻区
平均发货14小时
成功完成率95.98%
-
2
全新
四川省成都市
平均发货7小时
成功完成率98.73%
-
全新
河北省保定市
平均发货26小时
成功完成率85.96%
-
全新
北京市房山区
平均发货34小时
成功完成率82.81%
-
九品
北京市昌平区
平均发货23小时
成功完成率88.57%
-
九品
北京市东城区
平均发货25小时
成功完成率89.26%
-
2
全新
天津市河东区
平均发货25小时
成功完成率88.08%
-
全新
江苏省南京市
平均发货7小时
成功完成率95.62%
-
全新
江苏省无锡市
平均发货8小时
成功完成率96.27%
-
5
全新
北京市丰台区
平均发货28小时
成功完成率86.29%
-
文本分析与文本挖掘
按标题名购买,批量下载图片有时不对应,多本图片为其中一本,有问题请联系客服。
全新
河北省保定市
平均发货26小时
成功完成率89.99%
-
2
全新
北京市海淀区
平均发货9小时
成功完成率97.62%
-
2
全新
广东省广州市
平均发货17小时
成功完成率95.01%
-
2
全新
北京市西城区
平均发货11小时
成功完成率93.67%
-
2
全新
广东省广州市
平均发货17小时
成功完成率94.52%
-
4
九五品
广东省东莞市
平均发货6小时
成功完成率96.79%
-
4
九五品
广东省东莞市
平均发货6小时
成功完成率95.73%
-
全新
天津市河北区
平均发货26小时
成功完成率78.95%
-
2
全新
上海市浦东新区
平均发货22小时
成功完成率84.55%
-
全新
山东省潍坊市
平均发货17小时
成功完成率80.52%
-
全新
江苏省南京市
平均发货14小时
成功完成率81.81%
-
7
九五品
北京市通州区
平均发货7小时
成功完成率97.75%
-
全新
山东省潍坊市
平均发货17小时
成功完成率80.52%
-
全新
广东省广州市
平均发货10小时
成功完成率88.72%
-
2
全新
江苏省无锡市
平均发货10小时
成功完成率96.77%
-
全新
河北省保定市
平均发货15小时
成功完成率92.26%
-
11
九五品
江苏省南京市
平均发货2小时
成功完成率97.37%
-
5
九品
河南省信阳市
平均发货11小时
成功完成率97.1%
-
2
全新
北京市朝阳区
平均发货12小时
成功完成率83.21%
-
2
全新
广东省广州市
平均发货7小时
成功完成率89.34%
-
全新
北京市通州区
平均发货32小时
成功完成率85.23%
-
全新
北京市通州区
平均发货34小时
成功完成率87.65%
-
全新
北京市通州区
平均发货25小时
成功完成率89.04%
-
全新
北京市朝阳区
平均发货11小时
成功完成率92.64%
-
九品
北京市海淀区
平均发货24小时
成功完成率83.5%
-
文本分析与文本挖掘
正版图书。概不议价!请勿催单!急单勿拍!!!套装书请咨询后再拍。小本生意,经营不易,喜欢申请违约金和退款的同行与书友请绕行
全新
湖南省邵阳市
平均发货3小时
成功完成率84.06%
-
7
九品
北京市大兴区
平均发货9小时
成功完成率94.3%
-
全新
北京市通州区
平均发货25小时
成功完成率90.24%
-
九品
江苏省盐城市
平均发货20小时
成功完成率82.37%
-
6
全新
河北省廊坊市
平均发货10小时
成功完成率80.65%
-
全新
北京市通州区
平均发货47小时
成功完成率87.5%
-
九品
天津市宝坻区
平均发货16小时
成功完成率93.92%
-
九品
江苏省盐城市
平均发货18小时
成功完成率88.27%
-
九五品
天津市宝坻区
平均发货15小时
成功完成率62.83%
-
全新
海南省海口市
平均发货25小时
成功完成率84.49%