数据挖掘导论:(英文版)

数据挖掘导论:(英文版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , ,
2010-09
版次: 1
ISBN: 9787111316701
定价: 59.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 769页
120人买过
  • 《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。 Pang-Ning Tan现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。他的研究主要关注于为广泛的应用(包括医学信息学、地球科学、社会网络、Web挖掘和计算机安全)开发适用的数据挖掘算法。
    Michael Steinbach拥有明尼苏达大学数学学士学位、统计学硕士学位和计算机科学博士学位,现为明尼苏达大学双城分校计算机科学与工程系助理研究员。
    Vipin Kumar现为明尼苏达大学计算机科学与工程系主任和William Norris教授。1988年至2005年,他曾担任美国陆军高性能计算研究中心主任。 Preface

    1Introduction

    1.1WhatIsDataMining?

    1.2MotivatingChallenges

    1.3TheOriginsofDataMining

    1.4DataMiningTasks

    1.5ScopeandOrganizationoftheBook

    1.6BibliographicNotes

    1.7Exercises

    2Data

    2.1TypesofData

    2.1.1AttributesandMeasurement

    2.1.2TypesofDataSets

    2.2DataQuality

    2.2.1MeasurementandDataCollectionIssues

    2.2.2IssuesRelatedtoApplications

    2.3DataPreprocessing

    2.3.1Aggregation

    2.3.2Sampling

    2.3.3DimensionalityReduction

    2.3.4FeatureSubsetSelection

    2.3.5FeatureCreation

    2.3.6DiscretizationandBinarization

    2.3.7VariableTransformation

    2.4MeasuresofSimilarityandDissimilarity

    2.4.1Basics

    2.4.2SimilarityandDissimilaritybetweenSimpleAttributes.

    2.4.3DissimilaritiesbetweenDataObjects

    2.4.4SimilaritiesbetweenDataObjects

    2.4.5ExamplesofProximityMeasures

    2.4.6IssuesinProximityCalculation

    2.4.7SelectingtheRightProximityMeasure

    2.5BibliographicNotes

    2.6Exercises

    3ExploringData

    3.1TheIrisDataSet

    3.2SummaryStatistics

    3.2.1FrequenciesandtheMode

    3.2.2Percentiles

    3.2.3MeasuresofLocation:MeanandMedian

    3.2.4MeasuresofSpread:RangeandVariance

    3.2.5MultivariateSummaryStatistics

    3.2.6OtherWaystoSummarizetheData

    3.3Visualization

    3.3.1MotivationsforVisualization

    3.3.2GeneralConcepts

    3.3.3Techniques

    3.3.4VisualizingHigher-DimensionalData

    3.3.5Do'sandDon'ts

    3.4OLAPandMultidimensionalDataAnalysis

    3.4.1RepresentingIrisDataasaMultidimensionalArray

    3.4.2MultidimensionalData:TheGeneralCase

    3.4.3AnalyzingMultidimensionalData

    3.4.4FinalCommentsonMultidimensionalDataAnalysis

    3.5BibliographicNotes

    3.6Exercises

    Classification:

    4BasicConcepts,DecisionTrees,andModelEvaluation

    4.1Preliminaries

    4.2GeneralApproachtoSolvingaClassificationProblem

    4.3DecisionTreeInduction

    4.3.1HowaDecisionTreeWorks

    4.3.2HowtoBuildaDecisionTree

    4.3.3MethodsforExpressingAttributeTestConditions.

    4.3.4MeasuresforSelectingtheBestSplit

    4.3.5AlgorithmforDecisionTreeInduction

    4.3.6AnExample:WebRobotDetection

    4.3.7CharacteristicsofDecisionTreeInduction

    4.4ModelOverfitting

    4.4.1OverfittingDuetoPresenceofNoise

    4.4.2OverfittingDuetoLackofRepresentativeSamples.

    4.4.3OverfittingandtheMultipleComparisonProcedure

    4.4.4EstimationofGeneralizationErrors

    4.4.5HandlingOverfittinginDecisionTreeInduction..

    4.5EvaluatingthePerformanceofaClassifier

    4.5.1HoldoutMethod

    4.5.2RandomSubsampling

    4.5.3Cross-Validation

    4.5.4Bootstrap

    4.6MethodsforComparingClassifiers

    4.6.1EstimatingaConfidenceIntervalforAccuracy

    4.6.2ComparingthePerformanceofTwoModels

    4.6.3ComparingthePerformanceofTwoClassifiers

    4.7BibliographicNotes

    4.8Exercises

    5Classification:AlternativeTechniques

    6AssociationAnalysis:BasicConceptsandAlgorithms
  • 内容简介:
    《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。
  • 作者简介:
    Pang-Ning Tan现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。他的研究主要关注于为广泛的应用(包括医学信息学、地球科学、社会网络、Web挖掘和计算机安全)开发适用的数据挖掘算法。
    Michael Steinbach拥有明尼苏达大学数学学士学位、统计学硕士学位和计算机科学博士学位,现为明尼苏达大学双城分校计算机科学与工程系助理研究员。
    Vipin Kumar现为明尼苏达大学计算机科学与工程系主任和William Norris教授。1988年至2005年,他曾担任美国陆军高性能计算研究中心主任。
  • 目录:
    Preface

    1Introduction

    1.1WhatIsDataMining?

    1.2MotivatingChallenges

    1.3TheOriginsofDataMining

    1.4DataMiningTasks

    1.5ScopeandOrganizationoftheBook

    1.6BibliographicNotes

    1.7Exercises

    2Data

    2.1TypesofData

    2.1.1AttributesandMeasurement

    2.1.2TypesofDataSets

    2.2DataQuality

    2.2.1MeasurementandDataCollectionIssues

    2.2.2IssuesRelatedtoApplications

    2.3DataPreprocessing

    2.3.1Aggregation

    2.3.2Sampling

    2.3.3DimensionalityReduction

    2.3.4FeatureSubsetSelection

    2.3.5FeatureCreation

    2.3.6DiscretizationandBinarization

    2.3.7VariableTransformation

    2.4MeasuresofSimilarityandDissimilarity

    2.4.1Basics

    2.4.2SimilarityandDissimilaritybetweenSimpleAttributes.

    2.4.3DissimilaritiesbetweenDataObjects

    2.4.4SimilaritiesbetweenDataObjects

    2.4.5ExamplesofProximityMeasures

    2.4.6IssuesinProximityCalculation

    2.4.7SelectingtheRightProximityMeasure

    2.5BibliographicNotes

    2.6Exercises

    3ExploringData

    3.1TheIrisDataSet

    3.2SummaryStatistics

    3.2.1FrequenciesandtheMode

    3.2.2Percentiles

    3.2.3MeasuresofLocation:MeanandMedian

    3.2.4MeasuresofSpread:RangeandVariance

    3.2.5MultivariateSummaryStatistics

    3.2.6OtherWaystoSummarizetheData

    3.3Visualization

    3.3.1MotivationsforVisualization

    3.3.2GeneralConcepts

    3.3.3Techniques

    3.3.4VisualizingHigher-DimensionalData

    3.3.5Do'sandDon'ts

    3.4OLAPandMultidimensionalDataAnalysis

    3.4.1RepresentingIrisDataasaMultidimensionalArray

    3.4.2MultidimensionalData:TheGeneralCase

    3.4.3AnalyzingMultidimensionalData

    3.4.4FinalCommentsonMultidimensionalDataAnalysis

    3.5BibliographicNotes

    3.6Exercises

    Classification:

    4BasicConcepts,DecisionTrees,andModelEvaluation

    4.1Preliminaries

    4.2GeneralApproachtoSolvingaClassificationProblem

    4.3DecisionTreeInduction

    4.3.1HowaDecisionTreeWorks

    4.3.2HowtoBuildaDecisionTree

    4.3.3MethodsforExpressingAttributeTestConditions.

    4.3.4MeasuresforSelectingtheBestSplit

    4.3.5AlgorithmforDecisionTreeInduction

    4.3.6AnExample:WebRobotDetection

    4.3.7CharacteristicsofDecisionTreeInduction

    4.4ModelOverfitting

    4.4.1OverfittingDuetoPresenceofNoise

    4.4.2OverfittingDuetoLackofRepresentativeSamples.

    4.4.3OverfittingandtheMultipleComparisonProcedure

    4.4.4EstimationofGeneralizationErrors

    4.4.5HandlingOverfittinginDecisionTreeInduction..

    4.5EvaluatingthePerformanceofaClassifier

    4.5.1HoldoutMethod

    4.5.2RandomSubsampling

    4.5.3Cross-Validation

    4.5.4Bootstrap

    4.6MethodsforComparingClassifiers

    4.6.1EstimatingaConfidenceIntervalforAccuracy

    4.6.2ComparingthePerformanceofTwoModels

    4.6.3ComparingthePerformanceofTwoClassifiers

    4.7BibliographicNotes

    4.8Exercises

    5Classification:AlternativeTechniques

    6AssociationAnalysis:BasicConceptsandAlgorithms
查看详情
系列丛书 / 更多
数据挖掘导论:(英文版)
计算机网络
[荷兰]塔嫩鲍姆(Tanenbaum A.S.) 著
数据挖掘导论:(英文版)
Java编程思想:英文版·第4版
[美]埃克尔 著
数据挖掘导论:(英文版)
编译原理(英文版·第2版)
[美]阿霍 著
数据挖掘导论:(英文版)
计算机科学概论(英文版·第5版)
[美]Nell、John Lewis 著
数据挖掘导论:(英文版)
经典原版书库:电子商务(英文精编版·第10版)
[美]施内德(Gary P. Schneider) 著
数据挖掘导论:(英文版)
离散数学及其应用(英文版)(第7版)
[美]罗森 著
数据挖掘导论:(英文版)
计算机组成与设计:硬件/软件接口(英文版•第5版•亚洲版)
[美]David、John L.Hennessy 著
数据挖掘导论:(英文版)
现代操作系统(英文版·第4版)
[美]Andrew S. Tanenbaum、Herbert Bos 著
数据挖掘导论:(英文版)
计算机文化:(英文版·第15版)
[美]帕森斯(June Jamrich Parsons)、[美]奥贾(Dan Oja) 著
数据挖掘导论:(英文版)
Java语言程序设计:基础篇(英文版)(第8版)
[美]梁(Y.Daniel Liang) 著
数据挖掘导论:(英文版)
计算机科学引论(2017英文精编版)
[美]蒂莫西、J.、奥利里(Timothy、J.、O\\\\\\\'Leary) 著
数据挖掘导论:(英文版)
Java语言程序设计(基础篇)(英文版·第10版)
[美]梁勇(Y.Daniel Liang) 著
相关图书 / 更多
数据挖掘导论:(英文版)
数据治理实践者手记
苏振中
数据挖掘导论:(英文版)
数据中台:让数据用起来 第2版 付登坡 等
付登坡 江敏 赵东辉 等
数据挖掘导论:(英文版)
数据对话:建立你的数据流利度
(瑞士)马丁·埃普勒 法比耶纳 宾兹利
数据挖掘导论:(英文版)
数据结构高分(2025版 天勤3版) 大中专公共计算机 率辉 新华正版
率辉
数据挖掘导论:(英文版)
数据资源管理 陈忆金 奉国和
陈忆金 奉国和
数据挖掘导论:(英文版)
数据工程之道:设计和构建健壮的数据系统 [美]乔·里斯 [美]马特·豪斯利
[美]乔·里斯(Joe Reis),[美]马特·豪斯利(Matt Housley)
数据挖掘导论:(英文版)
数据法学前沿
武长海
数据挖掘导论:(英文版)
数据结构与算法入门到提高(Python语言实现)
谭琨、韦韬 编著
数据挖掘导论:(英文版)
数据合规与网络安全风险防范
冯洋
数据挖掘导论:(英文版)
数据加密与PKI应用(微课版)
王秀英
数据挖掘导论:(英文版)
数据治理驱动的数字化转型 王建峰 辛华
王建峰 辛华
数据挖掘导论:(英文版)
数据资产保护的合规要点与实务
辛小天,周杨,史蕾
您可能感兴趣 / 更多
数据挖掘导论:(英文版)
争吵的恋人:我们为什么相爱,又为什么争吵
[美]约翰·金,[美]瓦妮莎·贝内特
数据挖掘导论:(英文版)
蒙特卡洛的密码锁(数学大师的逻辑课) 文教科普读物 [美]雷蒙德·m.斯穆里安(raymondm.smullyan)
[美]雷蒙德·m.斯穆里安(raymondm.smullyan)
数据挖掘导论:(英文版)
全新正版图书 新任管理者快速成长蕾切尔·帕切科浙江教育出版社9787572277214
[美]蕾切尔· 帕切科
数据挖掘导论:(英文版)
《生命大设计.重构》(关于“生命创造现实”这一惊人事实,独特且完整的科学探索与哲学诠释)
[美]鲍勃·伯曼 著;杨泓 译;[美]罗伯特·兰札;马泰·帕夫希奇(斯洛文尼亚)
数据挖掘导论:(英文版)
杰出投资者的底层认知:成功投资与明智创富的10个茅塞顿开之问(《聪明的投资者》新时代精华版)
[美]J.戴维·斯坦恩(J.David Stein) 著;刘寅龙 译;庞鑫
数据挖掘导论:(英文版)
浴缸里的海洋
[美]塞思·菲什曼
数据挖掘导论:(英文版)
新视界文库-生命故事:生物学上的伟大发现
[美]肖恩·B.卡罗尔
数据挖掘导论:(英文版)
洛丽塔原型:小说《洛丽塔》背后的萨莉?霍纳绑架案
[美]萨拉·魏恩曼 著;真故图书 出品
数据挖掘导论:(英文版)
托尔斯泰
[美]莉莎·克纳普(Liza Knapp)
数据挖掘导论:(英文版)
奇迹之门 《纽约时报》畅销书作家写给孩子的一封“成长家书”。让父母的爱与肯定,成为孩子探索世界的底气。拥抱成长的不确定性,打开通向无限可能的“奇迹之门”。
[美]艾莉森·麦基/文 (美) 柳泰恩 图
数据挖掘导论:(英文版)
全球通史(全六册)(另一个角度的“全球通史”,不一样的视野与新知。以地理为骨,历史为肉,一部超级丰满的世界通史。)
[美]塞缪尔·古德里奇 译者:冷惠玲、冯佳娜、王小忠、孙丽霞、李江艳
数据挖掘导论:(英文版)
《星际争霸》动画影像艺术
[美]罗伯特·布鲁克斯