数据挖掘十大算法

数据挖掘十大算法
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] (Xindong Wu) , [美] (Vipin Kumar) , ,
2013-05
版次: 1
ISBN: 9787302310617
定价: 39.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 164页
字数: 256千字
正文语种: 简体中文
原版书名: The Top the Algorithms in Data Mining
95人买过
  •   《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途影响十种数据挖掘算法,这十种算法是数据挖掘领域的专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。   吴信东(XindongWu),教授英国爱丁堡大学人工智能学博士,任美国佛蒙特大学计算机科学系主任。吴教授在数据挖掘、知识系统和Web信息开发等研究领域内颇有建树,在IEEETKDE、TPAMI、ACMTOIS、DMKD、KAIS、IJCAI、AAAI、ICMI_、KDD、ICDM和WWW等学术会议和期刊上发表了170余篇学术论文,另外,还出版了18部学术专著和会议文集。他还获得了IEEEICTAI-2005的论文奖和IEEEICDM-2007的理论/算法论文奖亚军。
      吴博士是IEEETransactzonsonKnowLedgeandDataEngineering(TKDE,由IEEEComputerSociety主办)的主编,IEEEInternationalConerenceonDataMining(ICDM)的创始人和指导委员会主席,KnowledgeandInormationSystems(KAIS,由Springer发行)的创办人和荣誉主编,IEEEComputerSocietyTechnicalCommitteeonIntelligentInformatics(TCII)的创始主席(2002-2006),SpringerAdvancedInformationandKnowledgeProcessing(AI&KP)系列著作的编辑。他还是ICDM'03(the2003IEEEInternationalConferenceonDataMining)程序委员会主席和KDD-07(the13thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining)程序委员会联合主席。他获得了2004ACMSIGKDD服务奖、2006IEEEICDM杰出服务奖,是2005年合肥科技大学“长江学者奖励计划”讲座教授。他还是很多学术会议的特邀专家/专题报告人,如NSF-NGDM'07、PAKDD-07、IEEEEDOC'06、IEEEICTAI'04、IEEE/WIClACMWI'04lIAT'04、SEKE2002和PADD-97等。
      
      VipinKumar,教授,明尼苏达大学计算机科学与工程系WilliamNorris讲席教授、系主任。他于1977年获得印度鲁尔基理工学院(正式名称是鲁尔基大学)的电子和通信工程学士学位,1979年获得荷兰埃因霍温飞利浦国际学院的电子工程硕士学位,1982年获得马里兰大学帕克分校的计算机科学博士学位。Kumar教授的研究兴趣主要集中在数据挖掘、生物信息学和高性能计算领域。他提出了评估并行算法可扩展性的恒等效率度量指标,并研发了多款稀疏矩阵分解(PSPASES)和图剖分(METIS,ParMctis,hMetis)的高效并行算法及软件。他发表了200多篇研究论文,合编合著了9本学术专著,包括被广泛使用的教科书IntroductiontoParallelComputing和IntroductiontoDataMining,者5由Addison-Wesley出版。Kumar是众数据挖掘和多并行计算领域的学术会议、专题研讨会的主席或共同主席,女口IEEEInternationalConferenceonDataMining(2002)、InternationalParallelandDistributedProcessingSymposium(2001)和SIAMInternationalConferenceonDataMining(2001).Kumar是SIAMInternationalConferenceonDataMining指导委员会共同主席,IEEEInternationalConferenceonDataMining和IEEEInternationalConferenceonBioinformaticsandBiomedicine指导委员会委员。Kumar是JournalofStatisticalAnalysisandDataMining的创始主编之——,IEEEIntelligentInormaticsBulletin主编和DataMiningandKnowledgeDiscovery系列图书(由CRCPress/ChapmanHall出版)的编辑。Kumar还担任很多其他学术刊物的编辑,如DataMiningandKno-wledgeDiscovery、KnowLedgeandInformationSystems、IEEEComputationalInteltigenceBulletin、AnnualReviewofInteltigentInformatics、ParallelComputing、JournalofParallelandDistributedComputing、IEEETransactionsofDataandKno-wledgeEngineering(1993-1997)、IEEEConcurrency(1997-2000)和IEEEParalleLandDistributedTechnology(1995-1997)等。他是ACM会士、IEEE会士、AAAS会士和SIAM会员。Kumar由于在并行算法设计、图剖分和数据挖掘领域的杰出贡献,获得了2005IEEEComputerSociety的技术成就奖。 第1章C4.5
    1.1引言
    1.2算法描述
    1.3算法特性
    1.3.1决策树剪枝
    1.3.2连续型属性
    1.3.3缺失值处理
    1.3.4规则集诱导
    1.4软件实现
    1.5示例
    1.5.1Golf数据集
    1.5.2Soybean数据集
    1.6高级主题
    1.6.1二级存储
    1.6.2斜决策树
    1.6.3特征选择
    1.6.4集成方法
    1.6.5分类规则
    1.6.6模型重述
    1.7习题
    参考文献

    第2章k-means
    2.1引言
    2.2算法描述
    2.3可用软件
    2.4示例
    2.5高级主题
    2.6小结
    2.7习题
    参考文献

    第3章SVM:支持向量机
    3.1支持向量分类器
    3.2支持向量分类器的软间隔优化
    3.3核技巧
    3.4理论基础
    3.5支持向量回归器
    3.6软件实现
    3.7当前和未来的研究
    3.7.1计算效率
    3.7.2核的选择
    3.7.3泛化分析
    3.7.4结构化支持向量机的学习
    3.8习题
    参考文献

    第4章Apriori
    4.1引言
    4.2算法描述
    4.2.1挖掘频繁模式和关联规则
    4.2.2挖掘序列模式
    4.2.3讨论
    4.3软件实现
    4.4示例
    4.4.1可行示例
    4.4.2性能评估
    4.5高级主题
    4.5.1改进Apriori类型的频繁模式挖掘
    4.5.2无候选的频繁模式挖掘
    4.5.3增量式方法
    4.5.4稠密表示:闭合模式和最大模式
    4.5.5量化的关联规则
    4.5.6其他的重要性/兴趣度度量方法
    4.5.7类别关联规则
    4.5.8使用更丰富的形式:序列、树和图
    4.6小结
    4.7习题
    参考文献

    第5章EM
    5.1引言
    5.2算法描述
    ……

    第6章PageRank
    第7章AdaBoost
    第8章kNN!k-最近邻
    第9章NaiveBayes
    第10章CART:分类和回归树
  • 内容简介:
      《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途影响十种数据挖掘算法,这十种算法是数据挖掘领域的专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。
  • 作者简介:
      吴信东(XindongWu),教授英国爱丁堡大学人工智能学博士,任美国佛蒙特大学计算机科学系主任。吴教授在数据挖掘、知识系统和Web信息开发等研究领域内颇有建树,在IEEETKDE、TPAMI、ACMTOIS、DMKD、KAIS、IJCAI、AAAI、ICMI_、KDD、ICDM和WWW等学术会议和期刊上发表了170余篇学术论文,另外,还出版了18部学术专著和会议文集。他还获得了IEEEICTAI-2005的论文奖和IEEEICDM-2007的理论/算法论文奖亚军。
      吴博士是IEEETransactzonsonKnowLedgeandDataEngineering(TKDE,由IEEEComputerSociety主办)的主编,IEEEInternationalConerenceonDataMining(ICDM)的创始人和指导委员会主席,KnowledgeandInormationSystems(KAIS,由Springer发行)的创办人和荣誉主编,IEEEComputerSocietyTechnicalCommitteeonIntelligentInformatics(TCII)的创始主席(2002-2006),SpringerAdvancedInformationandKnowledgeProcessing(AI&KP)系列著作的编辑。他还是ICDM'03(the2003IEEEInternationalConferenceonDataMining)程序委员会主席和KDD-07(the13thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining)程序委员会联合主席。他获得了2004ACMSIGKDD服务奖、2006IEEEICDM杰出服务奖,是2005年合肥科技大学“长江学者奖励计划”讲座教授。他还是很多学术会议的特邀专家/专题报告人,如NSF-NGDM'07、PAKDD-07、IEEEEDOC'06、IEEEICTAI'04、IEEE/WIClACMWI'04lIAT'04、SEKE2002和PADD-97等。
      
      VipinKumar,教授,明尼苏达大学计算机科学与工程系WilliamNorris讲席教授、系主任。他于1977年获得印度鲁尔基理工学院(正式名称是鲁尔基大学)的电子和通信工程学士学位,1979年获得荷兰埃因霍温飞利浦国际学院的电子工程硕士学位,1982年获得马里兰大学帕克分校的计算机科学博士学位。Kumar教授的研究兴趣主要集中在数据挖掘、生物信息学和高性能计算领域。他提出了评估并行算法可扩展性的恒等效率度量指标,并研发了多款稀疏矩阵分解(PSPASES)和图剖分(METIS,ParMctis,hMetis)的高效并行算法及软件。他发表了200多篇研究论文,合编合著了9本学术专著,包括被广泛使用的教科书IntroductiontoParallelComputing和IntroductiontoDataMining,者5由Addison-Wesley出版。Kumar是众数据挖掘和多并行计算领域的学术会议、专题研讨会的主席或共同主席,女口IEEEInternationalConferenceonDataMining(2002)、InternationalParallelandDistributedProcessingSymposium(2001)和SIAMInternationalConferenceonDataMining(2001).Kumar是SIAMInternationalConferenceonDataMining指导委员会共同主席,IEEEInternationalConferenceonDataMining和IEEEInternationalConferenceonBioinformaticsandBiomedicine指导委员会委员。Kumar是JournalofStatisticalAnalysisandDataMining的创始主编之——,IEEEIntelligentInormaticsBulletin主编和DataMiningandKnowledgeDiscovery系列图书(由CRCPress/ChapmanHall出版)的编辑。Kumar还担任很多其他学术刊物的编辑,如DataMiningandKno-wledgeDiscovery、KnowLedgeandInformationSystems、IEEEComputationalInteltigenceBulletin、AnnualReviewofInteltigentInformatics、ParallelComputing、JournalofParallelandDistributedComputing、IEEETransactionsofDataandKno-wledgeEngineering(1993-1997)、IEEEConcurrency(1997-2000)和IEEEParalleLandDistributedTechnology(1995-1997)等。他是ACM会士、IEEE会士、AAAS会士和SIAM会员。Kumar由于在并行算法设计、图剖分和数据挖掘领域的杰出贡献,获得了2005IEEEComputerSociety的技术成就奖。
  • 目录:
    第1章C4.5
    1.1引言
    1.2算法描述
    1.3算法特性
    1.3.1决策树剪枝
    1.3.2连续型属性
    1.3.3缺失值处理
    1.3.4规则集诱导
    1.4软件实现
    1.5示例
    1.5.1Golf数据集
    1.5.2Soybean数据集
    1.6高级主题
    1.6.1二级存储
    1.6.2斜决策树
    1.6.3特征选择
    1.6.4集成方法
    1.6.5分类规则
    1.6.6模型重述
    1.7习题
    参考文献

    第2章k-means
    2.1引言
    2.2算法描述
    2.3可用软件
    2.4示例
    2.5高级主题
    2.6小结
    2.7习题
    参考文献

    第3章SVM:支持向量机
    3.1支持向量分类器
    3.2支持向量分类器的软间隔优化
    3.3核技巧
    3.4理论基础
    3.5支持向量回归器
    3.6软件实现
    3.7当前和未来的研究
    3.7.1计算效率
    3.7.2核的选择
    3.7.3泛化分析
    3.7.4结构化支持向量机的学习
    3.8习题
    参考文献

    第4章Apriori
    4.1引言
    4.2算法描述
    4.2.1挖掘频繁模式和关联规则
    4.2.2挖掘序列模式
    4.2.3讨论
    4.3软件实现
    4.4示例
    4.4.1可行示例
    4.4.2性能评估
    4.5高级主题
    4.5.1改进Apriori类型的频繁模式挖掘
    4.5.2无候选的频繁模式挖掘
    4.5.3增量式方法
    4.5.4稠密表示:闭合模式和最大模式
    4.5.5量化的关联规则
    4.5.6其他的重要性/兴趣度度量方法
    4.5.7类别关联规则
    4.5.8使用更丰富的形式:序列、树和图
    4.6小结
    4.7习题
    参考文献

    第5章EM
    5.1引言
    5.2算法描述
    ……

    第6章PageRank
    第7章AdaBoost
    第8章kNN!k-最近邻
    第9章NaiveBayes
    第10章CART:分类和回归树
查看详情
相关图书 / 更多
数据挖掘十大算法
数据中心经营之道 唐汝林 等
唐汝林 等
数据挖掘十大算法
数据管理十讲 袁野 崔斌 李战怀 等
袁野 崔斌 李战怀 等
数据挖掘十大算法
数据要素教程
杨东 白银 著
数据挖掘十大算法
数据驱动式教学:如何科学、有效、系统地提高学生成绩(深度剖析教学数据,助力教学决策,实时洞察学习动态,精准教学)
(美)罗伯特·J. 马扎诺,菲利普·B. 沃里克,卡梅伦·L. 雷恩斯 ,理查德·杜富尔著,张庆彬译; 中青文 出品
数据挖掘十大算法
数据确权的理论基础探索
彭诚信、史晓宇 著
数据挖掘十大算法
数据经济学
赵昌文,戎珂
数据挖掘十大算法
数据库原理与实践(MySQL版)()
杨俊杰,刘忠艳主编
数据挖掘十大算法
数据挖掘竞赛实战:方法与案例
许可乐
数据挖掘十大算法
数据要素估值
刘赛红、吕颖毅、王连军
数据挖掘十大算法
数据驱动的物流选址与调度模型及其实践
木仁 徐志强
数据挖掘十大算法
数据与人工智能驱动型公司:用数据和人工智能升级企业
(西) 理查德·本杰明(Richard Benjamins)
数据挖掘十大算法
数据库管理系统原理与实现
杜小勇、陈红、卢卫
您可能感兴趣 / 更多
数据挖掘十大算法
归属感:如何通过社群获得商业竞争优势
[美]大卫·斯平克斯(David Spinks) 著;颉腾文化 出品
数据挖掘十大算法
《世界上最大的肚子》2024百班千人暑期书目学前中班名师推荐全新正版现货速发
[美]雷米·查利普(美)柏顿·萨普瑞
数据挖掘十大算法
经济学通义
[美]阿门·A.阿尔钦 (美)威廉·R.艾伦 著;[美]杰里·L.乔丹 编
数据挖掘十大算法
数字化领导力 数字化转型锦囊,领导力精进指南 一本书掌握数字化转型领导力之道
[美]艾萨克·萨科里克 著;王磊 译;颉腾文化 出品;邓斌
数据挖掘十大算法
法哲学基本原理
[美]马克·C.墨菲
数据挖掘十大算法
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
数据挖掘十大算法
杜甫传
[美]弗洛伦斯.艾思柯
数据挖掘十大算法
神奇的数字零:从数字0开始的极简数学史和人类发展史
[美]查尔斯·塞弗(Charles Seife)著 杨杨立汝 译
数据挖掘十大算法
美利坚在燃烧:20世纪60年代以来的警察暴力与黑人反抗
[美]伊丽莎白·欣顿 著 胡位钧 译
数据挖掘十大算法
温柔亲启
[美]艾米莉·狄金森 著;[美]艾伦·路易斯·哈特、[美]玛莎·内尔·史密斯 编
数据挖掘十大算法
儒教中国及其现代命运(三部曲)
[美]列文森 作者;[中]季剑青 译者
数据挖掘十大算法
逃家小兔成长绘本系列
[美]玛格丽特.怀兹.布朗