数据挖掘导论:(英文版)

数据挖掘导论:(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , ,
2010-09
版次: 1
ISBN: 9787111316701
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 769页
120人买过
  • 《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。 Pang-Ning Tan现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。他的研究主要关注于为广泛的应用(包括医学信息学、地球科学、社会网络、Web挖掘和计算机安全)开发适用的数据挖掘算法。
    Michael Steinbach拥有明尼苏达大学数学学士学位、统计学硕士学位和计算机科学博士学位,现为明尼苏达大学双城分校计算机科学与工程系助理研究员。
    Vipin Kumar现为明尼苏达大学计算机科学与工程系主任和William Norris教授。1988年至2005年,他曾担任美国陆军高性能计算研究中心主任。 Preface

    1Introduction

    1.1WhatIsDataMining?

    1.2MotivatingChallenges

    1.3TheOriginsofDataMining

    1.4DataMiningTasks

    1.5ScopeandOrganizationoftheBook

    1.6BibliographicNotes

    1.7Exercises

    2Data

    2.1TypesofData

    2.1.1AttributesandMeasurement

    2.1.2TypesofDataSets

    2.2DataQuality

    2.2.1MeasurementandDataCollectionIssues

    2.2.2IssuesRelatedtoApplications

    2.3DataPreprocessing

    2.3.1Aggregation

    2.3.2Sampling

    2.3.3DimensionalityReduction

    2.3.4FeatureSubsetSelection

    2.3.5FeatureCreation

    2.3.6DiscretizationandBinarization

    2.3.7VariableTransformation

    2.4MeasuresofSimilarityandDissimilarity

    2.4.1Basics

    2.4.2SimilarityandDissimilaritybetweenSimpleAttributes.

    2.4.3DissimilaritiesbetweenDataObjects

    2.4.4SimilaritiesbetweenDataObjects

    2.4.5ExamplesofProximityMeasures

    2.4.6IssuesinProximityCalculation

    2.4.7SelectingtheRightProximityMeasure

    2.5BibliographicNotes

    2.6Exercises

    3ExploringData

    3.1TheIrisDataSet

    3.2SummaryStatistics

    3.2.1FrequenciesandtheMode

    3.2.2Percentiles

    3.2.3MeasuresofLocation:MeanandMedian

    3.2.4MeasuresofSpread:RangeandVariance

    3.2.5MultivariateSummaryStatistics

    3.2.6OtherWaystoSummarizetheData

    3.3Visualization

    3.3.1MotivationsforVisualization

    3.3.2GeneralConcepts

    3.3.3Techniques

    3.3.4VisualizingHigher-DimensionalData

    3.3.5Do'sandDon'ts

    3.4OLAPandMultidimensionalDataAnalysis

    3.4.1RepresentingIrisDataasaMultidimensionalArray

    3.4.2MultidimensionalData:TheGeneralCase

    3.4.3AnalyzingMultidimensionalData

    3.4.4FinalCommentsonMultidimensionalDataAnalysis

    3.5BibliographicNotes

    3.6Exercises

    Classification:

    4BasicConcepts,DecisionTrees,andModelEvaluation

    4.1Preliminaries

    4.2GeneralApproachtoSolvingaClassificationProblem

    4.3DecisionTreeInduction

    4.3.1HowaDecisionTreeWorks

    4.3.2HowtoBuildaDecisionTree

    4.3.3MethodsforExpressingAttributeTestConditions.

    4.3.4MeasuresforSelectingtheBestSplit

    4.3.5AlgorithmforDecisionTreeInduction

    4.3.6AnExample:WebRobotDetection

    4.3.7CharacteristicsofDecisionTreeInduction

    4.4ModelOverfitting

    4.4.1OverfittingDuetoPresenceofNoise

    4.4.2OverfittingDuetoLackofRepresentativeSamples.

    4.4.3OverfittingandtheMultipleComparisonProcedure

    4.4.4EstimationofGeneralizationErrors

    4.4.5HandlingOverfittinginDecisionTreeInduction..

    4.5EvaluatingthePerformanceofaClassifier

    4.5.1HoldoutMethod

    4.5.2RandomSubsampling

    4.5.3Cross-Validation

    4.5.4Bootstrap

    4.6MethodsforComparingClassifiers

    4.6.1EstimatingaConfidenceIntervalforAccuracy

    4.6.2ComparingthePerformanceofTwoModels

    4.6.3ComparingthePerformanceofTwoClassifiers

    4.7BibliographicNotes

    4.8Exercises

    5Classification:AlternativeTechniques

    6AssociationAnalysis:BasicConceptsandAlgorithms
  • 内容简介:
    《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。
  • 作者简介:
    Pang-Ning Tan现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。他的研究主要关注于为广泛的应用(包括医学信息学、地球科学、社会网络、Web挖掘和计算机安全)开发适用的数据挖掘算法。
    Michael Steinbach拥有明尼苏达大学数学学士学位、统计学硕士学位和计算机科学博士学位,现为明尼苏达大学双城分校计算机科学与工程系助理研究员。
    Vipin Kumar现为明尼苏达大学计算机科学与工程系主任和William Norris教授。1988年至2005年,他曾担任美国陆军高性能计算研究中心主任。
  • 目录:
    Preface

    1Introduction

    1.1WhatIsDataMining?

    1.2MotivatingChallenges

    1.3TheOriginsofDataMining

    1.4DataMiningTasks

    1.5ScopeandOrganizationoftheBook

    1.6BibliographicNotes

    1.7Exercises

    2Data

    2.1TypesofData

    2.1.1AttributesandMeasurement

    2.1.2TypesofDataSets

    2.2DataQuality

    2.2.1MeasurementandDataCollectionIssues

    2.2.2IssuesRelatedtoApplications

    2.3DataPreprocessing

    2.3.1Aggregation

    2.3.2Sampling

    2.3.3DimensionalityReduction

    2.3.4FeatureSubsetSelection

    2.3.5FeatureCreation

    2.3.6DiscretizationandBinarization

    2.3.7VariableTransformation

    2.4MeasuresofSimilarityandDissimilarity

    2.4.1Basics

    2.4.2SimilarityandDissimilaritybetweenSimpleAttributes.

    2.4.3DissimilaritiesbetweenDataObjects

    2.4.4SimilaritiesbetweenDataObjects

    2.4.5ExamplesofProximityMeasures

    2.4.6IssuesinProximityCalculation

    2.4.7SelectingtheRightProximityMeasure

    2.5BibliographicNotes

    2.6Exercises

    3ExploringData

    3.1TheIrisDataSet

    3.2SummaryStatistics

    3.2.1FrequenciesandtheMode

    3.2.2Percentiles

    3.2.3MeasuresofLocation:MeanandMedian

    3.2.4MeasuresofSpread:RangeandVariance

    3.2.5MultivariateSummaryStatistics

    3.2.6OtherWaystoSummarizetheData

    3.3Visualization

    3.3.1MotivationsforVisualization

    3.3.2GeneralConcepts

    3.3.3Techniques

    3.3.4VisualizingHigher-DimensionalData

    3.3.5Do'sandDon'ts

    3.4OLAPandMultidimensionalDataAnalysis

    3.4.1RepresentingIrisDataasaMultidimensionalArray

    3.4.2MultidimensionalData:TheGeneralCase

    3.4.3AnalyzingMultidimensionalData

    3.4.4FinalCommentsonMultidimensionalDataAnalysis

    3.5BibliographicNotes

    3.6Exercises

    Classification:

    4BasicConcepts,DecisionTrees,andModelEvaluation

    4.1Preliminaries

    4.2GeneralApproachtoSolvingaClassificationProblem

    4.3DecisionTreeInduction

    4.3.1HowaDecisionTreeWorks

    4.3.2HowtoBuildaDecisionTree

    4.3.3MethodsforExpressingAttributeTestConditions.

    4.3.4MeasuresforSelectingtheBestSplit

    4.3.5AlgorithmforDecisionTreeInduction

    4.3.6AnExample:WebRobotDetection

    4.3.7CharacteristicsofDecisionTreeInduction

    4.4ModelOverfitting

    4.4.1OverfittingDuetoPresenceofNoise

    4.4.2OverfittingDuetoLackofRepresentativeSamples.

    4.4.3OverfittingandtheMultipleComparisonProcedure

    4.4.4EstimationofGeneralizationErrors

    4.4.5HandlingOverfittinginDecisionTreeInduction..

    4.5EvaluatingthePerformanceofaClassifier

    4.5.1HoldoutMethod

    4.5.2RandomSubsampling

    4.5.3Cross-Validation

    4.5.4Bootstrap

    4.6MethodsforComparingClassifiers

    4.6.1EstimatingaConfidenceIntervalforAccuracy

    4.6.2ComparingthePerformanceofTwoModels

    4.6.3ComparingthePerformanceofTwoClassifiers

    4.7BibliographicNotes

    4.8Exercises

    5Classification:AlternativeTechniques

    6AssociationAnalysis:BasicConceptsandAlgorithms
查看详情
系列丛书 / 更多
数据挖掘导论:(英文版)
计算机网络
[荷兰]塔嫩鲍姆(Tanenbaum A.S.) 著
数据挖掘导论:(英文版)
Java编程思想:英文版·第4版
[美]埃克尔 著
数据挖掘导论:(英文版)
编译原理(英文版·第2版)
[美]阿霍 著
数据挖掘导论:(英文版)
计算机科学概论(英文版·第5版)
[美]Nell、John Lewis 著
数据挖掘导论:(英文版)
经典原版书库:电子商务(英文精编版·第10版)
[美]施内德(Gary P. Schneider) 著
数据挖掘导论:(英文版)
计算机组成与设计:硬件/软件接口(英文版•第5版•亚洲版)
[美]David、John L.Hennessy 著
数据挖掘导论:(英文版)
现代操作系统(英文版·第4版)
[美]Andrew S. Tanenbaum、Herbert Bos 著
数据挖掘导论:(英文版)
离散数学及其应用(英文版)(第7版)
[美]罗森 著
数据挖掘导论:(英文版)
Java语言程序设计:基础篇(英文版)(第8版)
[美]梁(Y.Daniel Liang) 著
数据挖掘导论:(英文版)
软件工程:实践者的研究方法(英文精编版 第8版)
[美]罗杰、[美]布鲁斯 R.马克西姆 著
数据挖掘导论:(英文版)
计算机文化:(英文版·第15版)
[美]帕森斯(June Jamrich Parsons)、[美]奥贾(Dan Oja) 著
数据挖掘导论:(英文版)
Java语言程序设计(基础篇)(英文版·第10版)
[美]梁勇(Y.Daniel Liang) 著
相关图书 / 更多
数据挖掘导论:(英文版)
数据新闻与信息可视化
周葆华;徐笛;崔迪
数据挖掘导论:(英文版)
数据合规师概论
郑少华、商建刚
数据挖掘导论:(英文版)
数据思维——从数据分析到商业价值(第2版)
王汉生
数据挖掘导论:(英文版)
数据科学优化方法
孙怡帆
数据挖掘导论:(英文版)
数据资产入表:理论与实务
赵治纲
数据挖掘导论:(英文版)
数据处理技术与方法研究
付雯
数据挖掘导论:(英文版)
数据治理 工业企业数字化转型之道 第2版
祝守宇
数据挖掘导论:(英文版)
数据可视化Pyecharts探秘实践教程/新工科大数据专业群实践丛书
余先昊、袁华 编
数据挖掘导论:(英文版)
数据标注工程——语言知识与应用
于东
数据挖掘导论:(英文版)
数据可视化基础与应用
刘佳 许桂秋 李静雯
数据挖掘导论:(英文版)
数据权利保护的模式与机制
余圣琪
数据挖掘导论:(英文版)
数据科学伦理:概念、技术和警世故事
[比利时]大卫·马滕斯(David;Martens
您可能感兴趣 / 更多
数据挖掘导论:(英文版)
孩子,把你的手给我1:怎么说孩子才爱听,怎么教孩子才肯学?帮助每一位3-12岁孩子的父母结束与孩子的所有冲突!
[美]海姆·G.吉诺特
数据挖掘导论:(英文版)
怎样做成大事
[美]丹·加德纳(Dan Gardner) 著;贾拥民 译;湛庐文化 出品;[丹麦]傅以斌(Bent Flyvbjerg)
数据挖掘导论:(英文版)
1200年希腊罗马神话
[美]伊迪丝·汉密尔顿
数据挖掘导论:(英文版)
爱情心理学(新编本)
[美]罗伯特·J. 斯腾伯格 (美)凯琳·斯腾伯格 倪爱萍 译
数据挖掘导论:(英文版)
黄金圈法则
[美]西蒙·斯涅克 著;磨铁文化 出品
数据挖掘导论:(英文版)
汤姆·索亚历险记 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]马克 吐温
数据挖掘导论:(英文版)
富兰克林自传 名家全译本 改变无数人命运的励志传奇 埃隆马斯克反复推荐 赠富兰克林签名照及精美插图
[美]本杰明·富兰克林 著;李自修 译
数据挖掘导论:(英文版)
意大利文艺复兴新艺术史
[美]迈克尔·韦恩·科尔 著;[美]斯蒂芬·J·坎贝尔;邵亦杨
数据挖掘导论:(英文版)
汤姆素亚历险记:中小学生课外阅读快乐读书吧 儿童文学无障碍有声伴读世界名著童话故事
[美]马克·吐温
数据挖掘导论:(英文版)
老人与海 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]海明威
数据挖掘导论:(英文版)
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
[美]凯文·莱曼 著;唐晓璐 译;斯坦威 出品
数据挖掘导论:(英文版)
国际大奖图画书系列 共11册(小老鼠的恐惧的大书,大灰狼,红豆与菲比,别烦我,下雪了 ,穿靴子的猫 ,先有蛋,绿 ,特别快递,如果你想看鲸鱼 ,一个部落的孩子 ) 麦克米伦世纪
[美]莱恩·史密斯 (英)埃米莉·格雷维特 (美)劳拉·瓦卡罗·等/文 (英)埃米莉·格雷维特 等/图 彭懿 杨玲玲 阿甲 孙慧阳 白薇 译