计算机组成与设计:硬件/软件接口(原书第4版)

计算机组成与设计:硬件/软件接口(原书第4版)
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: (David A.Patterson) , (John L.Hennessy) , , ,
2012-01
版次: 1
ISBN: 9787111353058
定价: 99.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 534页
正文语种: 简体中文
原版书名: Computer Organization and Design:The Hardware/Software Interface,Fourth Edition
455人买过
  •   《计算机组成与设计:硬件、软件接口》是计算机组成的经典教材。全书着眼于当前计算机设计中最基本的概念,展示了软硬件间的关系,并全面介绍当代计算机系统发展的主流技术和新成就。
    同以往版本一样,本书采用MIPS处理器作为展示计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能的核心。书中强调了计算机从串行到并行的新革新,在每章中都纳入了并行硬件和软件的主题,以软硬件协同设计发挥多核性能为最终目标。
      本书适合作为高等院校相关专业的本科生和研究生教材,对广大技术人员也有很高的参考价值。   DavidA.Patterson,加州大学伯克利分校计算机科学系教授,美国国家工程研究院院士,IEEE和ACM会士,曾因成功的启发式教育方法被IEEE授予JamesH.Muiiigan.Jr教育奖章。他因为对RISC技术的贡献而荣获1995年IEEE技术成就奖,而在RAID技术方面的成就为他赢得了1999年IEEE。ReynoldJohnson信息存储奖。2000年他和JohnL.Hennessy分享了JohnvonNeumann奖。
      JohnL.Hennessy,斯坦福大学接长。IEEE和ACM会士,美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章,他也是2001年SeymourCray计算机工程奖得主,并且和DavidA.Pafferson分享了2000年JohnvonNeumann奖。 出版者的话
    译者序
    前言
    第1章计算机概要与技术
    1.1引言
    1.1.1计算应用的分类及其特性
    1.1.2你能从本书学到什么
    1.2程序概念入门
    1.3硬件概念入门
    1.3.1剖析鼠标
    1.3.2显示器
    1.3.3打开机箱
    1.3.4数据安全
    1.3.5与其他计算机通信
    1.3.6处理器和存储器制造技术
    1.4性能
    1.4.1性能的定义
    1.4.2性能的测量
    1.4.3CPU性能及其因素
    1.4.4指令的性能
    1.4.5经典的CPU性能公式
    1.5功耗墙
    1.6沧海巨变:从单处理器向多处理器转变
    1.7实例:制造以及AMDOpteronX4基准
    1.7.1SPECCPU基准测试程序
    1.7.2SPEC功耗基准测试程序
    1.8谬误与陷阱
    1.9本章小结
    1.10拓展阅读
    1.11练习题
    第2章指令:计算机的语言
    2.1引言
    2.2计算机硬件的操作
    2.3计算机硬件的操作数
    2.3.1存储器操作数
    2.3.2常数或立即数操作数
    2.4有符号和无符号数
    2.5计算机中指令的表示
    2.6逻辑操作
    2.7决策指令
    2.7.1循环
    2.7.2case/switch语句
    2.8计算机硬件对过程的支持
    2.8.1使用更多的寄存器
    2.8.2嵌套过程
    2.8.3在栈中为新数据分配空间
    2.8.4在堆中为新数据分配空间
    2.9人机交互
    2.10MIPS中32位立即数和地址的寻址
    2.10.132位立即数
    2.10.2分支和跳转中的寻址
    2.10.3MIPS寻址模式总结
    2.10.4机器语言解码
    2.11并行与指令:同步
    2.12翻译并执行程序
    2.12.1编译器
    2.12.2汇编器
    2.12.3链接器
    2.12.4加载器
    2.12.5动态链接库
    2.12.6启动一个Java程序
    2.13以一个C排序程序为例
    2.13.1swap过程
    2.13.2sort过程
    2.14数组与指针
    2.14.1用数组实现clear
    2.14.2用指针实现clear
    2.14.3比较两个版本的clear
    2.15高级内容:编译C语言和解释Java语言
    2.16实例:ARM指令集
    2.16.1寻址模式
    2.16.2比较和条件分支
    2.16.3ARM的特色
    2.17实例:x86指令集
    2.17.1Intelx86的改进
    2.17.2x86寄存器和数据寻址模式
    2.17.3x86整数操作
    2.17.4x86指令编码
    2.17.5x86总结
    2.18谬误与陷阱
    2.19本章小结
    2.20拓展阅读
    2.21练习题
    第3章计算机的算术运算
    3.1引言
    3.2加法和减法
    3.2.1多媒体算术运算
    3.2.2小结
    3.3乘法
    3.3.1顺序的乘法算法和硬件
    3.3.2有符号乘法
    3.3.3更快速的乘法
    3.3.4MIPS中的乘法
    3.3.5小结
    3.4除法
    3.4.1除法算法及其硬件结构
    3.4.2有符号除法
    3.4.3更快速的除法
    3.4.4MIPS中的除法
    3.4.5小结
    3.5浮点运算
    3.5.1浮点表示
    3.5.2浮点加法
    3.5.3浮点乘法
    3.5.4MIPS中的浮点指令
    3.5.5算术精确性
    3.5.6小结
    3.6并行性和计算机算术:结合律
    3.7实例:x86的浮点
    3.7.1x86浮点体系结构
    3.7.2IntelSIMD流扩展2(SSE2)浮点体系结构
    3.8谬误与陷阱
    3.9本章小结
    3.10拓展阅读
    3.11练习题
    第4章处理器
    4.1引言
    4.1.1一个基本的MIPS实现
    4.1.2实现方式概述
    4.2逻辑设计惯例
    4.3建立数据通路
    4.4一个简单的实现机制
    4.4.1ALU控制
    4.4.2主控制单元的设计
    4.4.3数据通路的操作
    4.4.4控制的结束
    4.4.5为什么不使用单周期实现方式
    4.5流水线概述
    4.5.1面向流水线的指令集设计
    4.5.2流水线冒险
    4.5.3对流水线概述的小结
    4.6流水线数据通路及其控制
    4.6.1图形化表示的流水线
    4.6.2流水线控制
    4.7数据冒险:转发与阻塞
    4.8控制冒险
    4.8.1假定分支不发生
    4.8.2缩短分支的延迟
    4.8.3动态分支预测
    4.8.4流水线小结
    4.9异常
    4.9.1异常在MIPS体系结构中的处理
    4.9.2在流水线实现中的异常
    4.10并行和高级指令级并行
    4.10.1推测的概念
    4.10.2静态多发射处理器
    4.10.3动态多发射处理器
    4.11实例:AMDOpteronX4(Barcelona)流水线
    4.12高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例
    4.13谬误与陷阱
    4.14本章小结
    4.15拓展阅读
    4.16练习题
    第5章大容量和高速度:开发存储器层次结构
    5.1引言
    5.2cache的基本原理
    5.2.1cache访问
    5.2.2cache缺失处理
    5.2.3写操作处理
    5.2.4一个cache的例子:内置FastMATH处理器
    5.2.5设计支持cache的存储系统
    5.2.6小结
    5.3cache性能的评估和改进
    5.3.1通过更灵活地放置块来减少cache缺失
    5.3.2在cache中查找一个块
    5.3.3替换块的选择
    5.3.4使用多级cache结构减少缺失代价
    5.3.5小结
    5.4虚拟存储器
    5.4.1页的存放和查找
    5.4.2缺页
    5.4.3关于写
    5.4.4加快地址转换:TLB
    5.4.5集成虚拟存储器、TLB和cache
    5.4.6虚拟存储器中的保护
    5.4.7处理TLB缺失和缺页
    5.4.8小结
    5.5存储器层次结构的一般架构
    5.5.1问题1:一个块可以被放在何处
    5.5.2问题2:如何找到一个块
    5.5.3问题3:当cache缺失时替换哪一块
    5.5.4问题4:写操作如何处理
    5.5.53C:一种理解存储器层次结构行为的直观模型
    5.6虚拟机
    5.6.1虚拟机监视器的必备条件
    5.6.2指令集系统结构(缺乏)对虚拟机的支持
    5.6.3保护和指令集系统结构
    5.7使用有限状态机来控制简单的cache
    5.7.1一个简单的cache
    5.7.2有限状态机
    5.7.3一个简单的cache控制器的有限状态机
    5.8并行与存储器层次结构:cache一致性
    5.8.1实现一致性的基本方案
    5.8.2监听协议
    5.9高级内容:实现cache控制器
    5.10实例:AMDOpteronX4(Barcelona)和IntelNehalem的存储器层次结构
    5.10.1Nehalem和Opteron的存储器层次结构
    5.10.2减少缺失代价的技术
    5.11谬误和陷阱
    5.12本章小结
    5.13拓展阅读
    5.14练习题
    第6章存储器和其他I/O主题
    6.1引言
    6.2可信度、可靠性和可用性
    6.3磁盘存储器
    6.4快闪式存储器
    6.5连接处理器、内存以及I/O设备
    6.5.1互联基础
    6.5.2x86处理器的I/O互联
    6.6为处理器、内存和操作系统提供I/O设备接口
    6.6.1给I/O设备发送指令
    6.6.2与处理器通信
    6.6.3中断优先级
    6.6.4在设备与内存之间传输数据
    6.6.5直接存储器访问和内存系统
    6.7I/O性能度量:磁盘和文件系统的例子
    6.7.1事务处理I/O基准程序
    6.7.2文件系统和WebI/O的基准程序
    6.8设计I/O系统
    6.9并行性与I/O:廉价磁盘冗余阵列
    6.9.1无冗余(RAID0)
    6.9.2镜像(RAID1)
    6.9.3错误检测和纠错码(RAID2)
    6.9.4位交叉奇偶校验(RAID3)
    6.9.5块交叉奇偶校验(RAID4)
    6.9.6分布式块交叉奇偶校验(RAID5)
    6.9.7P+Q冗余(RAID6)
    6.9.8RAID小结
    6.10实例:SunFirex4150服务器
    6.11高级主题:网络
    6.12谬误与陷阱
    6.13本章小结
    6.14拓展阅读
    6.15练习题
    第7章多核、多处理器和集群
    7.1引言
    7.2创建并行处理程序的难点
    7.3共享存储多处理器
    7.4集群和其他消息传递多处理器
    7.5硬件多线程
    7.6SISD、MIMD、SIMD、SPMD和向量机
    7.6.1在x86中的SIMD:多媒体扩展
    7.6.2向量机
    7.6.3向量与标量的对比
    7.6.4向量与多媒体扩展的对比
    7.7图形处理单元简介
    7.7.1NVIDIAGPU体系结构简介
    7.7.2深入理解GPU
    7.8多处理器网络拓扑简介
    7.9多处理器基准测试程序
    7.10Roofline:一个简单的性能模型
    7.10.1Roofline模型
    7.10.2两代Opteron的比较
    7.11实例:使用屋顶线模型评估四种多核处理器
    7.11.14个多核系统
    7.11.2稀疏矩阵
    7.11.3结构化网格
    7.11.4生产率
    7.12谬误与陷阱
    7.13本章小结
    7.14拓展阅读
    7.15练习题
    附录A图形和计算GPU
    A.1引言
    A.1.1GPU发展简史
    A.1.2异构系统
    A.1.3GPU发展成了可扩展的并行处理器
    A.1.4为什么使用CUDA和GPU计算
    A.1.5GPU统一了图形和计算
    A.1.6GPU可视化计算的应用
    A.2GPU系统架构
    A.2.1异构CPU-GPU系统架构
    A.2.2GPU接口和驱动
    A.2.3图形逻辑流水线
    A.2.4将图形流水线映射到统一的GPU处理器
    A.2.5基本的统一GPU结构
    A.3可编程GPU
    A.3.1为实时图形编程
    A.3.2逻辑图形流水线
    A.3.3图形渲染程序
    A.3.4像素渲染示例
    A.3.5并行计算应用编程
    A.3.6使用CUDA进行可扩展并行编程
    A.3.7一些限制
    A.3.8体系结构隐含的问题
    A.4多线程的多处理器架构
    A.4.1大规模多线程
    A.4.2多处理器体系结构
    A.4.3单指令多线程(SIMT)
    A.4.4SIMTwarp执行和分支
    A.4.5管理线程和线程块
    A.4.6线程指令
    A.4.7指令集架构(ISA)
    A.4.8流处理器(SP)
    A.4.9特殊功能单元(SFU)
    A.4.10与其他多处理器的比较
    A.4.11多线程多处理器总结
    A.5并行存储系统
    A.5.1DRAM的考虑
    A.5.2cache
    A.5.3MMU
    A.5.4存储器空间
    A.5.5全局存储器
    A.5.6共享存储器
    A.5.7局部存储器
    A.5.8常量存储器
    A.5.9纹理存储器
    A.5.10表面
    A.5.11load/store访问
    A.5.12ROP
    A.6浮点算术
    A.6.1支持的格式
    A.6.2基本算术
    A.6.3专用算术
    A.6.4性能
    A.6.5双精度
    A.7资料:NVIDIAGeForce8800
    A.7.1流处理器阵列(SPA)
    A.7.2纹理/处理器簇(TPC)
    A.7.3流多处理器(SM)
    A.7.4指令集
    A.7.5流处理器(SP)
    A.7.6特殊功能单元(SFU)
    A.7.7光栅化
    A.7.8光栅操作处理器(ROP)和存储系统
    A.7.9可扩展性
    A.7.10性能
    A.7.11密集线性代数性能
    A.7.12FFT性能
    A.7.13排序性能
    A.8资料:将应用映射到GPU
    A.8.1稀疏矩阵
    A.8.2在共享存储器中进行缓存
    A.8.3扫描和归约
    A.8.4基数排序
    A.8.5GPU上的N-Body应用
    A.9谬误与陷阱
    A.10小结
    A.11拓展阅读
    附录B汇编器、链接器和SPIM仿真器
    B.1引言
    B.1.1什么时候使用汇编语言
    B.1.2汇编语言的缺点
    B.2汇编器
    B.2.1目标文件的格式
    B.2.2附加工具
    B.3链接器
    B.4加载
    B.5内存的使用
    B.6过程调用规范
    B.6.1过程调用
    B.6.2过程调用举例
    B.6.3另外一个过程调用的例子
    B.7异常和中断
    B.8输入和输出
    B.9SPIM
    B.10MIPSR2000汇编语言
    B.10.1寻址方式
    B.10.2汇编语法
    B.10.3MIPS指令编码
    B.10.4指令格式
    B.10.5常数操作指令
    B.10.6比较指令
    B.10.7分支指令
    B.10.8跳转指令
    B.10.9陷阱指令
    B.10.10取数指令
    B.10.11保存指令
    B.10.12数据传送指令
    B.10.13浮点运算指令
    B.10.14异常和中断指令
    B.11小结
    B.12参考文献
    B.13练习题
  • 内容简介:
      《计算机组成与设计:硬件、软件接口》是计算机组成的经典教材。全书着眼于当前计算机设计中最基本的概念,展示了软硬件间的关系,并全面介绍当代计算机系统发展的主流技术和新成就。
    同以往版本一样,本书采用MIPS处理器作为展示计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能的核心。书中强调了计算机从串行到并行的新革新,在每章中都纳入了并行硬件和软件的主题,以软硬件协同设计发挥多核性能为最终目标。
      本书适合作为高等院校相关专业的本科生和研究生教材,对广大技术人员也有很高的参考价值。
  • 作者简介:
      DavidA.Patterson,加州大学伯克利分校计算机科学系教授,美国国家工程研究院院士,IEEE和ACM会士,曾因成功的启发式教育方法被IEEE授予JamesH.Muiiigan.Jr教育奖章。他因为对RISC技术的贡献而荣获1995年IEEE技术成就奖,而在RAID技术方面的成就为他赢得了1999年IEEE。ReynoldJohnson信息存储奖。2000年他和JohnL.Hennessy分享了JohnvonNeumann奖。
      JohnL.Hennessy,斯坦福大学接长。IEEE和ACM会士,美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章,他也是2001年SeymourCray计算机工程奖得主,并且和DavidA.Pafferson分享了2000年JohnvonNeumann奖。
  • 目录:
    出版者的话
    译者序
    前言
    第1章计算机概要与技术
    1.1引言
    1.1.1计算应用的分类及其特性
    1.1.2你能从本书学到什么
    1.2程序概念入门
    1.3硬件概念入门
    1.3.1剖析鼠标
    1.3.2显示器
    1.3.3打开机箱
    1.3.4数据安全
    1.3.5与其他计算机通信
    1.3.6处理器和存储器制造技术
    1.4性能
    1.4.1性能的定义
    1.4.2性能的测量
    1.4.3CPU性能及其因素
    1.4.4指令的性能
    1.4.5经典的CPU性能公式
    1.5功耗墙
    1.6沧海巨变:从单处理器向多处理器转变
    1.7实例:制造以及AMDOpteronX4基准
    1.7.1SPECCPU基准测试程序
    1.7.2SPEC功耗基准测试程序
    1.8谬误与陷阱
    1.9本章小结
    1.10拓展阅读
    1.11练习题
    第2章指令:计算机的语言
    2.1引言
    2.2计算机硬件的操作
    2.3计算机硬件的操作数
    2.3.1存储器操作数
    2.3.2常数或立即数操作数
    2.4有符号和无符号数
    2.5计算机中指令的表示
    2.6逻辑操作
    2.7决策指令
    2.7.1循环
    2.7.2case/switch语句
    2.8计算机硬件对过程的支持
    2.8.1使用更多的寄存器
    2.8.2嵌套过程
    2.8.3在栈中为新数据分配空间
    2.8.4在堆中为新数据分配空间
    2.9人机交互
    2.10MIPS中32位立即数和地址的寻址
    2.10.132位立即数
    2.10.2分支和跳转中的寻址
    2.10.3MIPS寻址模式总结
    2.10.4机器语言解码
    2.11并行与指令:同步
    2.12翻译并执行程序
    2.12.1编译器
    2.12.2汇编器
    2.12.3链接器
    2.12.4加载器
    2.12.5动态链接库
    2.12.6启动一个Java程序
    2.13以一个C排序程序为例
    2.13.1swap过程
    2.13.2sort过程
    2.14数组与指针
    2.14.1用数组实现clear
    2.14.2用指针实现clear
    2.14.3比较两个版本的clear
    2.15高级内容:编译C语言和解释Java语言
    2.16实例:ARM指令集
    2.16.1寻址模式
    2.16.2比较和条件分支
    2.16.3ARM的特色
    2.17实例:x86指令集
    2.17.1Intelx86的改进
    2.17.2x86寄存器和数据寻址模式
    2.17.3x86整数操作
    2.17.4x86指令编码
    2.17.5x86总结
    2.18谬误与陷阱
    2.19本章小结
    2.20拓展阅读
    2.21练习题
    第3章计算机的算术运算
    3.1引言
    3.2加法和减法
    3.2.1多媒体算术运算
    3.2.2小结
    3.3乘法
    3.3.1顺序的乘法算法和硬件
    3.3.2有符号乘法
    3.3.3更快速的乘法
    3.3.4MIPS中的乘法
    3.3.5小结
    3.4除法
    3.4.1除法算法及其硬件结构
    3.4.2有符号除法
    3.4.3更快速的除法
    3.4.4MIPS中的除法
    3.4.5小结
    3.5浮点运算
    3.5.1浮点表示
    3.5.2浮点加法
    3.5.3浮点乘法
    3.5.4MIPS中的浮点指令
    3.5.5算术精确性
    3.5.6小结
    3.6并行性和计算机算术:结合律
    3.7实例:x86的浮点
    3.7.1x86浮点体系结构
    3.7.2IntelSIMD流扩展2(SSE2)浮点体系结构
    3.8谬误与陷阱
    3.9本章小结
    3.10拓展阅读
    3.11练习题
    第4章处理器
    4.1引言
    4.1.1一个基本的MIPS实现
    4.1.2实现方式概述
    4.2逻辑设计惯例
    4.3建立数据通路
    4.4一个简单的实现机制
    4.4.1ALU控制
    4.4.2主控制单元的设计
    4.4.3数据通路的操作
    4.4.4控制的结束
    4.4.5为什么不使用单周期实现方式
    4.5流水线概述
    4.5.1面向流水线的指令集设计
    4.5.2流水线冒险
    4.5.3对流水线概述的小结
    4.6流水线数据通路及其控制
    4.6.1图形化表示的流水线
    4.6.2流水线控制
    4.7数据冒险:转发与阻塞
    4.8控制冒险
    4.8.1假定分支不发生
    4.8.2缩短分支的延迟
    4.8.3动态分支预测
    4.8.4流水线小结
    4.9异常
    4.9.1异常在MIPS体系结构中的处理
    4.9.2在流水线实现中的异常
    4.10并行和高级指令级并行
    4.10.1推测的概念
    4.10.2静态多发射处理器
    4.10.3动态多发射处理器
    4.11实例:AMDOpteronX4(Barcelona)流水线
    4.12高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例
    4.13谬误与陷阱
    4.14本章小结
    4.15拓展阅读
    4.16练习题
    第5章大容量和高速度:开发存储器层次结构
    5.1引言
    5.2cache的基本原理
    5.2.1cache访问
    5.2.2cache缺失处理
    5.2.3写操作处理
    5.2.4一个cache的例子:内置FastMATH处理器
    5.2.5设计支持cache的存储系统
    5.2.6小结
    5.3cache性能的评估和改进
    5.3.1通过更灵活地放置块来减少cache缺失
    5.3.2在cache中查找一个块
    5.3.3替换块的选择
    5.3.4使用多级cache结构减少缺失代价
    5.3.5小结
    5.4虚拟存储器
    5.4.1页的存放和查找
    5.4.2缺页
    5.4.3关于写
    5.4.4加快地址转换:TLB
    5.4.5集成虚拟存储器、TLB和cache
    5.4.6虚拟存储器中的保护
    5.4.7处理TLB缺失和缺页
    5.4.8小结
    5.5存储器层次结构的一般架构
    5.5.1问题1:一个块可以被放在何处
    5.5.2问题2:如何找到一个块
    5.5.3问题3:当cache缺失时替换哪一块
    5.5.4问题4:写操作如何处理
    5.5.53C:一种理解存储器层次结构行为的直观模型
    5.6虚拟机
    5.6.1虚拟机监视器的必备条件
    5.6.2指令集系统结构(缺乏)对虚拟机的支持
    5.6.3保护和指令集系统结构
    5.7使用有限状态机来控制简单的cache
    5.7.1一个简单的cache
    5.7.2有限状态机
    5.7.3一个简单的cache控制器的有限状态机
    5.8并行与存储器层次结构:cache一致性
    5.8.1实现一致性的基本方案
    5.8.2监听协议
    5.9高级内容:实现cache控制器
    5.10实例:AMDOpteronX4(Barcelona)和IntelNehalem的存储器层次结构
    5.10.1Nehalem和Opteron的存储器层次结构
    5.10.2减少缺失代价的技术
    5.11谬误和陷阱
    5.12本章小结
    5.13拓展阅读
    5.14练习题
    第6章存储器和其他I/O主题
    6.1引言
    6.2可信度、可靠性和可用性
    6.3磁盘存储器
    6.4快闪式存储器
    6.5连接处理器、内存以及I/O设备
    6.5.1互联基础
    6.5.2x86处理器的I/O互联
    6.6为处理器、内存和操作系统提供I/O设备接口
    6.6.1给I/O设备发送指令
    6.6.2与处理器通信
    6.6.3中断优先级
    6.6.4在设备与内存之间传输数据
    6.6.5直接存储器访问和内存系统
    6.7I/O性能度量:磁盘和文件系统的例子
    6.7.1事务处理I/O基准程序
    6.7.2文件系统和WebI/O的基准程序
    6.8设计I/O系统
    6.9并行性与I/O:廉价磁盘冗余阵列
    6.9.1无冗余(RAID0)
    6.9.2镜像(RAID1)
    6.9.3错误检测和纠错码(RAID2)
    6.9.4位交叉奇偶校验(RAID3)
    6.9.5块交叉奇偶校验(RAID4)
    6.9.6分布式块交叉奇偶校验(RAID5)
    6.9.7P+Q冗余(RAID6)
    6.9.8RAID小结
    6.10实例:SunFirex4150服务器
    6.11高级主题:网络
    6.12谬误与陷阱
    6.13本章小结
    6.14拓展阅读
    6.15练习题
    第7章多核、多处理器和集群
    7.1引言
    7.2创建并行处理程序的难点
    7.3共享存储多处理器
    7.4集群和其他消息传递多处理器
    7.5硬件多线程
    7.6SISD、MIMD、SIMD、SPMD和向量机
    7.6.1在x86中的SIMD:多媒体扩展
    7.6.2向量机
    7.6.3向量与标量的对比
    7.6.4向量与多媒体扩展的对比
    7.7图形处理单元简介
    7.7.1NVIDIAGPU体系结构简介
    7.7.2深入理解GPU
    7.8多处理器网络拓扑简介
    7.9多处理器基准测试程序
    7.10Roofline:一个简单的性能模型
    7.10.1Roofline模型
    7.10.2两代Opteron的比较
    7.11实例:使用屋顶线模型评估四种多核处理器
    7.11.14个多核系统
    7.11.2稀疏矩阵
    7.11.3结构化网格
    7.11.4生产率
    7.12谬误与陷阱
    7.13本章小结
    7.14拓展阅读
    7.15练习题
    附录A图形和计算GPU
    A.1引言
    A.1.1GPU发展简史
    A.1.2异构系统
    A.1.3GPU发展成了可扩展的并行处理器
    A.1.4为什么使用CUDA和GPU计算
    A.1.5GPU统一了图形和计算
    A.1.6GPU可视化计算的应用
    A.2GPU系统架构
    A.2.1异构CPU-GPU系统架构
    A.2.2GPU接口和驱动
    A.2.3图形逻辑流水线
    A.2.4将图形流水线映射到统一的GPU处理器
    A.2.5基本的统一GPU结构
    A.3可编程GPU
    A.3.1为实时图形编程
    A.3.2逻辑图形流水线
    A.3.3图形渲染程序
    A.3.4像素渲染示例
    A.3.5并行计算应用编程
    A.3.6使用CUDA进行可扩展并行编程
    A.3.7一些限制
    A.3.8体系结构隐含的问题
    A.4多线程的多处理器架构
    A.4.1大规模多线程
    A.4.2多处理器体系结构
    A.4.3单指令多线程(SIMT)
    A.4.4SIMTwarp执行和分支
    A.4.5管理线程和线程块
    A.4.6线程指令
    A.4.7指令集架构(ISA)
    A.4.8流处理器(SP)
    A.4.9特殊功能单元(SFU)
    A.4.10与其他多处理器的比较
    A.4.11多线程多处理器总结
    A.5并行存储系统
    A.5.1DRAM的考虑
    A.5.2cache
    A.5.3MMU
    A.5.4存储器空间
    A.5.5全局存储器
    A.5.6共享存储器
    A.5.7局部存储器
    A.5.8常量存储器
    A.5.9纹理存储器
    A.5.10表面
    A.5.11load/store访问
    A.5.12ROP
    A.6浮点算术
    A.6.1支持的格式
    A.6.2基本算术
    A.6.3专用算术
    A.6.4性能
    A.6.5双精度
    A.7资料:NVIDIAGeForce8800
    A.7.1流处理器阵列(SPA)
    A.7.2纹理/处理器簇(TPC)
    A.7.3流多处理器(SM)
    A.7.4指令集
    A.7.5流处理器(SP)
    A.7.6特殊功能单元(SFU)
    A.7.7光栅化
    A.7.8光栅操作处理器(ROP)和存储系统
    A.7.9可扩展性
    A.7.10性能
    A.7.11密集线性代数性能
    A.7.12FFT性能
    A.7.13排序性能
    A.8资料:将应用映射到GPU
    A.8.1稀疏矩阵
    A.8.2在共享存储器中进行缓存
    A.8.3扫描和归约
    A.8.4基数排序
    A.8.5GPU上的N-Body应用
    A.9谬误与陷阱
    A.10小结
    A.11拓展阅读
    附录B汇编器、链接器和SPIM仿真器
    B.1引言
    B.1.1什么时候使用汇编语言
    B.1.2汇编语言的缺点
    B.2汇编器
    B.2.1目标文件的格式
    B.2.2附加工具
    B.3链接器
    B.4加载
    B.5内存的使用
    B.6过程调用规范
    B.6.1过程调用
    B.6.2过程调用举例
    B.6.3另外一个过程调用的例子
    B.7异常和中断
    B.8输入和输出
    B.9SPIM
    B.10MIPSR2000汇编语言
    B.10.1寻址方式
    B.10.2汇编语法
    B.10.3MIPS指令编码
    B.10.4指令格式
    B.10.5常数操作指令
    B.10.6比较指令
    B.10.7分支指令
    B.10.8跳转指令
    B.10.9陷阱指令
    B.10.10取数指令
    B.10.11保存指令
    B.10.12数据传送指令
    B.10.13浮点运算指令
    B.10.14异常和中断指令
    B.11小结
    B.12参考文献
    B.13练习题
查看详情
系列丛书 / 更多
计算机组成与设计:硬件/软件接口(原书第4版)
Java编程思想(第4版)
[美]Bruce Eckel 著;陈昊鹏 译
计算机组成与设计:硬件/软件接口(原书第4版)
数据挖掘:概念与技术(原书第3版)
[美]Jiawei、[美]Micheling、[美]Jian Pei 著;范明、孟小峰 译
计算机组成与设计:硬件/软件接口(原书第4版)
算法导论(原书第3版)
[美]Thomas、[美]Charles、[美]Ronald、[美]Clifford Stein 著;殷建平、徐云、王刚 译
计算机组成与设计:硬件/软件接口(原书第4版)
数据结构与算法分析:Java语言描述
[美]马克·艾伦·维斯 著;陈越 译
计算机组成与设计:硬件/软件接口(原书第4版)
C程序设计语言(第2版·新版) 习题解答
吉米拜尔 著;杨涛 译;[美]汤朵
计算机组成与设计:硬件/软件接口(原书第4版)
C程序设计语言(第二版)
[美]Brian(布莱恩·克尼汉)、[美]Dennis M.Ritchie(丹尼斯·里奇) 著;徐宝文、李志 译
计算机组成与设计:硬件/软件接口(原书第4版)
计算机科学丛书·云计算:概念、技术与架构
[美]Thomas、[英]Zaigham、[巴西]Ricardo Puttini 著;龚奕利、贺莲、胡创 译
计算机组成与设计:硬件/软件接口(原书第4版)
深入理解计算机系统(原书第3版)
[美]兰德尔 E.布莱恩特(Randal E.·Bryant) 著;龚奕利、贺莲 译
计算机组成与设计:硬件/软件接口(原书第4版)
计算机科学导论:原书第3版
[美]Behrouz Forouzan 著;刘艺 译
计算机组成与设计:硬件/软件接口(原书第4版)
数据库系统概念:(原书第6版)
[美]Abraham、Henry、S.Sudarshan 著;杨冬青、李红燕、唐世渭 译
计算机组成与设计:硬件/软件接口(原书第4版)
编译原理:原理、技术与工具
[美]阿霍 著;赵建华 译
计算机组成与设计:硬件/软件接口(原书第4版)
软件工程:实践者的研究方法(原书第8版 本科教学版)
[美]罗杰 S. 普莱斯曼 著;郑人杰、马素霞 译
相关图书 / 更多
计算机组成与设计:硬件/软件接口(原书第4版)
计算机基础与实训教程
顾玲芳 编
计算机组成与设计:硬件/软件接口(原书第4版)
计算机网络攻击与防护
刘念;陈雪松;谈洪磊
计算机组成与设计:硬件/软件接口(原书第4版)
计算机组成原理与汇编语言
田民格、秦彩杰、林观俊、田佳琪
计算机组成与设计:硬件/软件接口(原书第4版)
计算天文
冯毅
计算机组成与设计:硬件/软件接口(原书第4版)
计算思维培养与无人机创意编程
范谊 陈宇 张锦东
计算机组成与设计:硬件/软件接口(原书第4版)
计算机组成原理与系统结构(第3版)
冯建文 章复嘉 赵建勇 包健 编著
计算机组成与设计:硬件/软件接口(原书第4版)
计算小状元 小学数学 2年级上册 bs版 小学数学单元测试 新华
作者
计算机组成与设计:硬件/软件接口(原书第4版)
计算机应用基础
苗苗
计算机组成与设计:硬件/软件接口(原书第4版)
计算机系统原理(2023年版) 全国高等教育自学考试指导委员会
全国高等教育自学考试指导委员会
计算机组成与设计:硬件/软件接口(原书第4版)
计算机组装与维护(第3版高等院校计算机应用技术规划教材)
孙中胜 编
计算机组成与设计:硬件/软件接口(原书第4版)
计算机辅助翻译教程()
赵秋荣
计算机组成与设计:硬件/软件接口(原书第4版)
计算机三维建模方法
易健宏 编著;李凤仙
您可能感兴趣 / 更多
计算机组成与设计:硬件/软件接口(原书第4版)
小学阶段的编程教育
帕特森、王卫 著;山姆•
计算机组成与设计:硬件/软件接口(原书第4版)
超级谋杀组合
帕特森 著
计算机组成与设计:硬件/软件接口(原书第4版)
期刊编辑
帕特森
计算机组成与设计:硬件/软件接口(原书第4版)
猫和老鼠
帕特森
计算机组成与设计:硬件/软件接口(原书第4版)
家庭治疗技术
帕特森(Patterson JoEllen) 著;方晓义 译