计算机组成与设计:硬件/软件接口(原书第4版)

计算机组成与设计
9.1
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: (David A.Patterson) (John L.Hennessy)
出版社: 机械工业出版社
2012-01
版次: 1
ISBN: 9787111353058
定价: 99.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 534页
正文语种: 简体中文
原版书名: Computer Organization and Design:The Hardware/Software Interface,Fourth Edition
  •   《计算机组成与设计:硬件、软件接口》是计算机组成的经典教材。全书着眼于当前计算机设计中最基本的概念,展示了软硬件间的关系,并全面介绍当代计算机系统发展的主流技术和新成就。
    同以往版本一样,本书采用MIPS处理器作为展示计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能的核心。书中强调了计算机从串行到并行的新革新,在每章中都纳入了并行硬件和软件的主题,以软硬件协同设计发挥多核性能为最终目标。
      本书适合作为高等院校相关专业的本科生和研究生教材,对广大技术人员也有很高的参考价值。   DavidA.Patterson,加州大学伯克利分校计算机科学系教授,美国国家工程研究院院士,IEEE和ACM会士,曾因成功的启发式教育方法被IEEE授予JamesH.Muiiigan.Jr教育奖章。他因为对RISC技术的贡献而荣获1995年IEEE技术成就奖,而在RAID技术方面的成就为他赢得了1999年IEEE。ReynoldJohnson信息存储奖。2000年他和JohnL.Hennessy分享了JohnvonNeumann奖。
      JohnL.Hennessy,斯坦福大学接长。IEEE和ACM会士,美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章,他也是2001年SeymourCray计算机工程奖得主,并且和DavidA.Pafferson分享了2000年JohnvonNeumann奖。 出版者的话译者序前言第1章计算机概要与技术1.1引言1.1.1计算应用的分类及其特性1.1.2你能从本书学到什么1.2程序概念入门1.3硬件概念入门1.3.1剖析鼠标1.3.2显示器1.3.3打开机箱1.3.4数据安全1.3.5与其他计算机通信1.3.6处理器和存储器制造技术1.4性能1.4.1性能的定义1.4.2性能的测量1.4.3CPU性能及其因素1.4.4指令的性能1.4.5经典的CPU性能公式1.5功耗墙1.6沧海巨变:从单处理器向多处理器转变1.7实例:制造以及AMDOpteronX4基准1.7.1SPECCPU基准测试程序1.7.2SPEC功耗基准测试程序1.8谬误与陷阱1.9本章小结1.10拓展阅读1.11练习题第2章指令:计算机的语言2.1引言2.2计算机硬件的操作2.3计算机硬件的操作数2.3.1存储器操作数2.3.2常数或立即数操作数2.4有符号和无符号数2.5计算机中指令的表示2.6逻辑操作2.7决策指令2.7.1循环2.7.2case/switch语句2.8计算机硬件对过程的支持2.8.1使用更多的寄存器2.8.2嵌套过程2.8.3在栈中为新数据分配空间2.8.4在堆中为新数据分配空间2.9人机交互2.10MIPS中32位立即数和地址的寻址2.10.132位立即数2.10.2分支和跳转中的寻址2.10.3MIPS寻址模式总结2.10.4机器语言解码2.11并行与指令:同步2.12翻译并执行程序2.12.1编译器2.12.2汇编器2.12.3链接器2.12.4加载器2.12.5动态链接库2.12.6启动一个Java程序2.13以一个C排序程序为例2.13.1swap过程2.13.2sort过程2.14数组与指针2.14.1用数组实现clear2.14.2用指针实现clear2.14.3比较两个版本的clear2.15高级内容:编译C语言和解释Java语言2.16实例:ARM指令集2.16.1寻址模式2.16.2比较和条件分支2.16.3ARM的特色2.17实例:x86指令集2.17.1Intelx86的改进2.17.2x86寄存器和数据寻址模式2.17.3x86整数操作2.17.4x86指令编码2.17.5x86总结2.18谬误与陷阱2.19本章小结2.20拓展阅读2.21练习题第3章计算机的算术运算3.1引言3.2加法和减法3.2.1多媒体算术运算3.2.2小结3.3乘法3.3.1顺序的乘法算法和硬件3.3.2有符号乘法3.3.3更快速的乘法3.3.4MIPS中的乘法3.3.5小结3.4除法3.4.1除法算法及其硬件结构3.4.2有符号除法3.4.3更快速的除法3.4.4MIPS中的除法3.4.5小结3.5浮点运算3.5.1浮点表示3.5.2浮点加法3.5.3浮点乘法3.5.4MIPS中的浮点指令3.5.5算术精确性3.5.6小结3.6并行性和计算机算术:结合律3.7实例:x86的浮点3.7.1x86浮点体系结构3.7.2IntelSIMD流扩展2(SSE2)浮点体系结构3.8谬误与陷阱3.9本章小结3.10拓展阅读3.11练习题第4章处理器4.1引言4.1.1一个基本的MIPS实现4.1.2实现方式概述4.2逻辑设计惯例4.3建立数据通路4.4一个简单的实现机制4.4.1ALU控制4.4.2主控制单元的设计4.4.3数据通路的操作4.4.4控制的结束4.4.5为什么不使用单周期实现方式4.5流水线概述4.5.1面向流水线的指令集设计4.5.2流水线冒险4.5.3对流水线概述的小结4.6流水线数据通路及其控制4.6.1图形化表示的流水线4.6.2流水线控制4.7数据冒险:转发与阻塞4.8控制冒险4.8.1假定分支不发生4.8.2缩短分支的延迟4.8.3动态分支预测4.8.4流水线小结4.9异常4.9.1异常在MIPS体系结构中的处理4.9.2在流水线实现中的异常4.10并行和高级指令级并行4.10.1推测的概念4.10.2静态多发射处理器4.10.3动态多发射处理器4.11实例:AMDOpteronX4(Barcelona)流水线4.12高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例4.13谬误与陷阱4.14本章小结4.15拓展阅读4.16练习题第5章大容量和高速度:开发存储器层次结构5.1引言5.2cache的基本原理5.2.1cache访问5.2.2cache缺失处理5.2.3写操作处理5.2.4一个cache的例子:内置FastMATH处理器5.2.5设计支持cache的存储系统5.2.6小结5.3cache性能的评估和改进5.3.1通过更灵活地放置块来减少cache缺失5.3.2在cache中查找一个块5.3.3替换块的选择5.3.4使用多级cache结构减少缺失代价5.3.5小结5.4虚拟存储器5.4.1页的存放和查找5.4.2缺页5.4.3关于写5.4.4加快地址转换:TLB5.4.5集成虚拟存储器、TLB和cache5.4.6虚拟存储器中的保护5.4.7处理TLB缺失和缺页5.4.8小结5.5存储器层次结构的一般架构5.5.1问题1:一个块可以被放在何处5.5.2问题2:如何找到一个块5.5.3问题3:当cache缺失时替换哪一块5.5.4问题4:写操作如何处理5.5.53C:一种理解存储器层次结构行为的直观模型5.6虚拟机5.6.1虚拟机监视器的必备条件5.6.2指令集系统结构(缺乏)对虚拟机的支持5.6.3保护和指令集系统结构5.7使用有限状态机来控制简单的cache5.7.1一个简单的cache5.7.2有限状态机5.7.3一个简单的cache控制器的有限状态机5.8并行与存储器层次结构:cache一致性5.8.1实现一致性的基本方案5.8.2监听协议5.9高级内容:实现cache控制器5.10实例:AMDOpteronX4(Barcelona)和IntelNehalem的存储器层次结构5.10.1Nehalem和Opteron的存储器层次结构5.10.2减少缺失代价的技术5.11谬误和陷阱5.12本章小结5.13拓展阅读5.14练习题第6章存储器和其他I/O主题6.1引言6.2可信度、可靠性和可用性6.3磁盘存储器6.4快闪式存储器6.5连接处理器、内存以及I/O设备6.5.1互联基础6.5.2x86处理器的I/O互联6.6为处理器、内存和操作系统提供I/O设备接口6.6.1给I/O设备发送指令6.6.2与处理器通信6.6.3中断优先级6.6.4在设备与内存之间传输数据6.6.5直接存储器访问和内存系统6.7I/O性能度量:磁盘和文件系统的例子6.7.1事务处理I/O基准程序6.7.2文件系统和WebI/O的基准程序6.8设计I/O系统6.9并行性与I/O:廉价磁盘冗余阵列6.9.1无冗余(RAID0)6.9.2镜像(RAID1)6.9.3错误检测和纠错码(RAID2)6.9.4位交叉奇偶校验(RAID3)6.9.5块交叉奇偶校验(RAID4)6.9.6分布式块交叉奇偶校验(RAID5)6.9.7P+Q冗余(RAID6)6.9.8RAID小结6.10实例:SunFirex4150服务器6.11高级主题:网络6.12谬误与陷阱6.13本章小结6.14拓展阅读6.15练习题第7章多核、多处理器和集群7.1引言7.2创建并行处理程序的难点7.3共享存储多处理器7.4集群和其他消息传递多处理器7.5硬件多线程7.6SISD、MIMD、SIMD、SPMD和向量机7.6.1在x86中的SIMD:多媒体扩展7.6.2向量机7.6.3向量与标量的对比7.6.4向量与多媒体扩展的对比7.7图形处理单元简介7.7.1NVIDIAGPU体系结构简介7.7.2深入理解GPU7.8多处理器网络拓扑简介7.9多处理器基准测试程序7.10Roofline:一个简单的性能模型7.10.1Roofline模型7.10.2两代Opteron的比较7.11实例:使用屋顶线模型评估四种多核处理器7.11.14个多核系统7.11.2稀疏矩阵7.11.3结构化网格7.11.4生产率7.12谬误与陷阱7.13本章小结7.14拓展阅读7.15练习题附录A图形和计算GPUA.1引言A.1.1GPU发展简史A.1.2异构系统A.1.3GPU发展成了可扩展的并行处理器A.1.4为什么使用CUDA和GPU计算A.1.5GPU统一了图形和计算A.1.6GPU可视化计算的应用A.2GPU系统架构A.2.1异构CPU-GPU系统架构A.2.2GPU接口和驱动A.2.3图形逻辑流水线A.2.4将图形流水线映射到统一的GPU处理器A.2.5基本的统一GPU结构A.3可编程GPUA.3.1为实时图形编程A.3.2逻辑图形流水线A.3.3图形渲染程序A.3.4像素渲染示例A.3.5并行计算应用编程A.3.6使用CUDA进行可扩展并行编程A.3.7一些限制A.3.8体系结构隐含的问题A.4多线程的多处理器架构A.4.1大规模多线程A.4.2多处理器体系结构A.4.3单指令多线程(SIMT)A.4.4SIMTwarp执行和分支A.4.5管理线程和线程块A.4.6线程指令A.4.7指令集架构(ISA)A.4.8流处理器(SP)A.4.9特殊功能单元(SFU)A.4.10与其他多处理器的比较A.4.11多线程多处理器总结A.5并行存储系统A.5.1DRAM的考虑A.5.2cacheA.5.3MMUA.5.4存储器空间A.5.5全局存储器A.5.6共享存储器A.5.7局部存储器A.5.8常量存储器A.5.9纹理存储器A.5.10表面A.5.11load/store访问A.5.12ROPA.6浮点算术A.6.1支持的格式A.6.2基本算术A.6.3专用算术A.6.4性能A.6.5双精度A.7资料:NVIDIAGeForce8800A.7.1流处理器阵列(SPA)A.7.2纹理/处理器簇(TPC)A.7.3流多处理器(SM)A.7.4指令集A.7.5流处理器(SP)A.7.6特殊功能单元(SFU)A.7.7光栅化A.7.8光栅操作处理器(ROP)和存储系统A.7.9可扩展性A.7.10性能A.7.11密集线性代数性能A.7.12FFT性能A.7.13排序性能A.8资料:将应用映射到GPUA.8.1稀疏矩阵A.8.2在共享存储器中进行缓存A.8.3扫描和归约A.8.4基数排序A.8.5GPU上的N-Body应用A.9谬误与陷阱A.10小结A.11拓展阅读附录B汇编器、链接器和SPIM仿真器B.1引言B.1.1什么时候使用汇编语言B.1.2汇编语言的缺点B.2汇编器B.2.1目标文件的格式B.2.2附加工具B.3链接器B.4加载B.5内存的使用B.6过程调用规范B.6.1过程调用B.6.2过程调用举例B.6.3另外一个过程调用的例子B.7异常和中断B.8输入和输出B.9SPIMB.10MIPSR2000汇编语言B.10.1寻址方式B.10.2汇编语法B.10.3MIPS指令编码B.10.4指令格式B.10.5常数操作指令B.10.6比较指令B.10.7分支指令B.10.8跳转指令B.10.9陷阱指令B.10.10取数指令B.10.11保存指令B.10.12数据传送指令B.10.13浮点运算指令B.10.14异常和中断指令B.11小结B.12参考文献B.13练习题
  • 内容简介:
      《计算机组成与设计:硬件、软件接口》是计算机组成的经典教材。全书着眼于当前计算机设计中最基本的概念,展示了软硬件间的关系,并全面介绍当代计算机系统发展的主流技术和新成就。
    同以往版本一样,本书采用MIPS处理器作为展示计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能的核心。书中强调了计算机从串行到并行的新革新,在每章中都纳入了并行硬件和软件的主题,以软硬件协同设计发挥多核性能为最终目标。
      本书适合作为高等院校相关专业的本科生和研究生教材,对广大技术人员也有很高的参考价值。
  • 作者简介:
      DavidA.Patterson,加州大学伯克利分校计算机科学系教授,美国国家工程研究院院士,IEEE和ACM会士,曾因成功的启发式教育方法被IEEE授予JamesH.Muiiigan.Jr教育奖章。他因为对RISC技术的贡献而荣获1995年IEEE技术成就奖,而在RAID技术方面的成就为他赢得了1999年IEEE。ReynoldJohnson信息存储奖。2000年他和JohnL.Hennessy分享了JohnvonNeumann奖。
      JohnL.Hennessy,斯坦福大学接长。IEEE和ACM会士,美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章,他也是2001年SeymourCray计算机工程奖得主,并且和DavidA.Pafferson分享了2000年JohnvonNeumann奖。
  • 目录:
    出版者的话译者序前言第1章计算机概要与技术1.1引言1.1.1计算应用的分类及其特性1.1.2你能从本书学到什么1.2程序概念入门1.3硬件概念入门1.3.1剖析鼠标1.3.2显示器1.3.3打开机箱1.3.4数据安全1.3.5与其他计算机通信1.3.6处理器和存储器制造技术1.4性能1.4.1性能的定义1.4.2性能的测量1.4.3CPU性能及其因素1.4.4指令的性能1.4.5经典的CPU性能公式1.5功耗墙1.6沧海巨变:从单处理器向多处理器转变1.7实例:制造以及AMDOpteronX4基准1.7.1SPECCPU基准测试程序1.7.2SPEC功耗基准测试程序1.8谬误与陷阱1.9本章小结1.10拓展阅读1.11练习题第2章指令:计算机的语言2.1引言2.2计算机硬件的操作2.3计算机硬件的操作数2.3.1存储器操作数2.3.2常数或立即数操作数2.4有符号和无符号数2.5计算机中指令的表示2.6逻辑操作2.7决策指令2.7.1循环2.7.2case/switch语句2.8计算机硬件对过程的支持2.8.1使用更多的寄存器2.8.2嵌套过程2.8.3在栈中为新数据分配空间2.8.4在堆中为新数据分配空间2.9人机交互2.10MIPS中32位立即数和地址的寻址2.10.132位立即数2.10.2分支和跳转中的寻址2.10.3MIPS寻址模式总结2.10.4机器语言解码2.11并行与指令:同步2.12翻译并执行程序2.12.1编译器2.12.2汇编器2.12.3链接器2.12.4加载器2.12.5动态链接库2.12.6启动一个Java程序2.13以一个C排序程序为例2.13.1swap过程2.13.2sort过程2.14数组与指针2.14.1用数组实现clear2.14.2用指针实现clear2.14.3比较两个版本的clear2.15高级内容:编译C语言和解释Java语言2.16实例:ARM指令集2.16.1寻址模式2.16.2比较和条件分支2.16.3ARM的特色2.17实例:x86指令集2.17.1Intelx86的改进2.17.2x86寄存器和数据寻址模式2.17.3x86整数操作2.17.4x86指令编码2.17.5x86总结2.18谬误与陷阱2.19本章小结2.20拓展阅读2.21练习题第3章计算机的算术运算3.1引言3.2加法和减法3.2.1多媒体算术运算3.2.2小结3.3乘法3.3.1顺序的乘法算法和硬件3.3.2有符号乘法3.3.3更快速的乘法3.3.4MIPS中的乘法3.3.5小结3.4除法3.4.1除法算法及其硬件结构3.4.2有符号除法3.4.3更快速的除法3.4.4MIPS中的除法3.4.5小结3.5浮点运算3.5.1浮点表示3.5.2浮点加法3.5.3浮点乘法3.5.4MIPS中的浮点指令3.5.5算术精确性3.5.6小结3.6并行性和计算机算术:结合律3.7实例:x86的浮点3.7.1x86浮点体系结构3.7.2IntelSIMD流扩展2(SSE2)浮点体系结构3.8谬误与陷阱3.9本章小结3.10拓展阅读3.11练习题第4章处理器4.1引言4.1.1一个基本的MIPS实现4.1.2实现方式概述4.2逻辑设计惯例4.3建立数据通路4.4一个简单的实现机制4.4.1ALU控制4.4.2主控制单元的设计4.4.3数据通路的操作4.4.4控制的结束4.4.5为什么不使用单周期实现方式4.5流水线概述4.5.1面向流水线的指令集设计4.5.2流水线冒险4.5.3对流水线概述的小结4.6流水线数据通路及其控制4.6.1图形化表示的流水线4.6.2流水线控制4.7数据冒险:转发与阻塞4.8控制冒险4.8.1假定分支不发生4.8.2缩短分支的延迟4.8.3动态分支预测4.8.4流水线小结4.9异常4.9.1异常在MIPS体系结构中的处理4.9.2在流水线实现中的异常4.10并行和高级指令级并行4.10.1推测的概念4.10.2静态多发射处理器4.10.3动态多发射处理器4.11实例:AMDOpteronX4(Barcelona)流水线4.12高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例4.13谬误与陷阱4.14本章小结4.15拓展阅读4.16练习题第5章大容量和高速度:开发存储器层次结构5.1引言5.2cache的基本原理5.2.1cache访问5.2.2cache缺失处理5.2.3写操作处理5.2.4一个cache的例子:内置FastMATH处理器5.2.5设计支持cache的存储系统5.2.6小结5.3cache性能的评估和改进5.3.1通过更灵活地放置块来减少cache缺失5.3.2在cache中查找一个块5.3.3替换块的选择5.3.4使用多级cache结构减少缺失代价5.3.5小结5.4虚拟存储器5.4.1页的存放和查找5.4.2缺页5.4.3关于写5.4.4加快地址转换:TLB5.4.5集成虚拟存储器、TLB和cache5.4.6虚拟存储器中的保护5.4.7处理TLB缺失和缺页5.4.8小结5.5存储器层次结构的一般架构5.5.1问题1:一个块可以被放在何处5.5.2问题2:如何找到一个块5.5.3问题3:当cache缺失时替换哪一块5.5.4问题4:写操作如何处理5.5.53C:一种理解存储器层次结构行为的直观模型5.6虚拟机5.6.1虚拟机监视器的必备条件5.6.2指令集系统结构(缺乏)对虚拟机的支持5.6.3保护和指令集系统结构5.7使用有限状态机来控制简单的cache5.7.1一个简单的cache5.7.2有限状态机5.7.3一个简单的cache控制器的有限状态机5.8并行与存储器层次结构:cache一致性5.8.1实现一致性的基本方案5.8.2监听协议5.9高级内容:实现cache控制器5.10实例:AMDOpteronX4(Barcelona)和IntelNehalem的存储器层次结构5.10.1Nehalem和Opteron的存储器层次结构5.10.2减少缺失代价的技术5.11谬误和陷阱5.12本章小结5.13拓展阅读5.14练习题第6章存储器和其他I/O主题6.1引言6.2可信度、可靠性和可用性6.3磁盘存储器6.4快闪式存储器6.5连接处理器、内存以及I/O设备6.5.1互联基础6.5.2x86处理器的I/O互联6.6为处理器、内存和操作系统提供I/O设备接口6.6.1给I/O设备发送指令6.6.2与处理器通信6.6.3中断优先级6.6.4在设备与内存之间传输数据6.6.5直接存储器访问和内存系统6.7I/O性能度量:磁盘和文件系统的例子6.7.1事务处理I/O基准程序6.7.2文件系统和WebI/O的基准程序6.8设计I/O系统6.9并行性与I/O:廉价磁盘冗余阵列6.9.1无冗余(RAID0)6.9.2镜像(RAID1)6.9.3错误检测和纠错码(RAID2)6.9.4位交叉奇偶校验(RAID3)6.9.5块交叉奇偶校验(RAID4)6.9.6分布式块交叉奇偶校验(RAID5)6.9.7P+Q冗余(RAID6)6.9.8RAID小结6.10实例:SunFirex4150服务器6.11高级主题:网络6.12谬误与陷阱6.13本章小结6.14拓展阅读6.15练习题第7章多核、多处理器和集群7.1引言7.2创建并行处理程序的难点7.3共享存储多处理器7.4集群和其他消息传递多处理器7.5硬件多线程7.6SISD、MIMD、SIMD、SPMD和向量机7.6.1在x86中的SIMD:多媒体扩展7.6.2向量机7.6.3向量与标量的对比7.6.4向量与多媒体扩展的对比7.7图形处理单元简介7.7.1NVIDIAGPU体系结构简介7.7.2深入理解GPU7.8多处理器网络拓扑简介7.9多处理器基准测试程序7.10Roofline:一个简单的性能模型7.10.1Roofline模型7.10.2两代Opteron的比较7.11实例:使用屋顶线模型评估四种多核处理器7.11.14个多核系统7.11.2稀疏矩阵7.11.3结构化网格7.11.4生产率7.12谬误与陷阱7.13本章小结7.14拓展阅读7.15练习题附录A图形和计算GPUA.1引言A.1.1GPU发展简史A.1.2异构系统A.1.3GPU发展成了可扩展的并行处理器A.1.4为什么使用CUDA和GPU计算A.1.5GPU统一了图形和计算A.1.6GPU可视化计算的应用A.2GPU系统架构A.2.1异构CPU-GPU系统架构A.2.2GPU接口和驱动A.2.3图形逻辑流水线A.2.4将图形流水线映射到统一的GPU处理器A.2.5基本的统一GPU结构A.3可编程GPUA.3.1为实时图形编程A.3.2逻辑图形流水线A.3.3图形渲染程序A.3.4像素渲染示例A.3.5并行计算应用编程A.3.6使用CUDA进行可扩展并行编程A.3.7一些限制A.3.8体系结构隐含的问题A.4多线程的多处理器架构A.4.1大规模多线程A.4.2多处理器体系结构A.4.3单指令多线程(SIMT)A.4.4SIMTwarp执行和分支A.4.5管理线程和线程块A.4.6线程指令A.4.7指令集架构(ISA)A.4.8流处理器(SP)A.4.9特殊功能单元(SFU)A.4.10与其他多处理器的比较A.4.11多线程多处理器总结A.5并行存储系统A.5.1DRAM的考虑A.5.2cacheA.5.3MMUA.5.4存储器空间A.5.5全局存储器A.5.6共享存储器A.5.7局部存储器A.5.8常量存储器A.5.9纹理存储器A.5.10表面A.5.11load/store访问A.5.12ROPA.6浮点算术A.6.1支持的格式A.6.2基本算术A.6.3专用算术A.6.4性能A.6.5双精度A.7资料:NVIDIAGeForce8800A.7.1流处理器阵列(SPA)A.7.2纹理/处理器簇(TPC)A.7.3流多处理器(SM)A.7.4指令集A.7.5流处理器(SP)A.7.6特殊功能单元(SFU)A.7.7光栅化A.7.8光栅操作处理器(ROP)和存储系统A.7.9可扩展性A.7.10性能A.7.11密集线性代数性能A.7.12FFT性能A.7.13排序性能A.8资料:将应用映射到GPUA.8.1稀疏矩阵A.8.2在共享存储器中进行缓存A.8.3扫描和归约A.8.4基数排序A.8.5GPU上的N-Body应用A.9谬误与陷阱A.10小结A.11拓展阅读附录B汇编器、链接器和SPIM仿真器B.1引言B.1.1什么时候使用汇编语言B.1.2汇编语言的缺点B.2汇编器B.2.1目标文件的格式B.2.2附加工具B.3链接器B.4加载B.5内存的使用B.6过程调用规范B.6.1过程调用B.6.2过程调用举例B.6.3另外一个过程调用的例子B.7异常和中断B.8输入和输出B.9SPIMB.10MIPSR2000汇编语言B.10.1寻址方式B.10.2汇编语法B.10.3MIPS指令编码B.10.4指令格式B.10.5常数操作指令B.10.6比较指令B.10.7分支指令B.10.8跳转指令B.10.9陷阱指令B.10.10取数指令B.10.11保存指令B.10.12数据传送指令B.10.13浮点运算指令B.10.14异常和中断指令B.11小结B.12参考文献B.13练习题
查看详情
好书推荐 / 更多
计算机组成与设计
星空帝国 中国古代星宿揭秘
徐刚、王燕平 著
计算机组成与设计
南十字星共和国:俄国象征派小说选
[俄]费·索洛古勃;[俄]瓦·勃留索夫;[俄]安德列·别雷
计算机组成与设计
逃之夭夭
[德]马丁·瓦尔泽 著;黄燎宇 译
计算机组成与设计
巴黎评论·诗人访谈
美国《巴黎评论》编辑部、美国《巴黎评论》编辑部 编;明迪 译
计算机组成与设计
鼠小兵:黑斧
[美]大卫·彼得森 著;方堃 译
计算机组成与设计
成为我自己:欧文·亚隆回忆录
[美]欧文·D.亚隆(Irvin D. Yalom) 著
计算机组成与设计
九色鹿·从“异域”到“旧疆”:宋至清贵州西北部地区的制度、开发与认同
温春来 著
计算机组成与设计
米格尔在智利的地下行动
[哥伦比亚]加西亚.马尔克斯 著
计算机组成与设计
谈话录
王安忆;张新颖
计算机组成与设计
漫画电影史(图像小说版《认识电影》,迷影人士必读漫画)
[英]爱德华·罗斯 著
计算机组成与设计
所有的名字
[葡萄牙]若泽·萨拉马戈 著;王渊 译
计算机组成与设计
皮肤的秘密:关于皮肤的17堂课!解读关于人体最大器官的一切!
刘立 译;[德]卡提雅•史匹哲(Katja Spitzer) 绘;[德]耶尔•阿德勒(Yael Adler)