计算机组成与设计(原书第5版):硬件/软件接口

计算机组成与设计(原书第5版):硬件/软件接口
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] , [美] , , ,
2015-07
版次: 1
ISBN: 9787111504825
定价: 99.00
装帧: 平装
开本: 16开
纸张: 胶版纸
页数: 536页
正文语种: 简体中文
原版书名: Computer Organization and Design:The Hardware/Software Interface,Fifth Edition
1801人买过
  •   《计算机组成与设计:硬件/软件接口(原书第5版)》是计算机组成与设计的经典畅销教材,第5版经过全面更新,关注后PC时代发生在计算机体系结构领域的革命性变革——从单核处理器到多核微处理器,从串行到并行。本书特别关注移动计算和云计算,通过平板电脑、云体系结构以及ARM(移动计算设备)和x86(云计算)体系结构来探索和揭示这场技术变革。  与前几版一样,本书采用MIPS处理器讲解计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能。  《计算机组成与设计:硬件/软件接口(原书第5版)》特点  更新例题、练习题和参考资料,重点关注移动计算和云计算这两个新领域。  涵盖从串行计算到并行计算的革命性变革,第6章专门介绍并行处理器,每章中都涉及并行硬件和软件的相关主题。  全书采用IntelCorei7、ARMCortex-A8和NVIDIAFermiGPU作为实例。  增加“运行更快”这一新实例,说明正确理解硬件技术的重要性,它能使软件性能提高200倍。  讨论并强调计算机体系结构的“8个伟大思想”——通过并行提高性能、通过流水线提高性能、通过预测提高性能、面向摩尔定律的设计、存储器层次、使用抽象简化设计、加速大概率事件和通过冗余提高可靠性。   DavidA.Patterson,加州大学伯克利分校计算机科学系教授,IEEE和ACM会士,美国国家工程院、国家科学院和美国艺术与科学院院士,美国计算机历史博物馆院士,并入选硅谷工程名人堂。Patterson曾荣获加州大学杰出教学奖、ACMKarlstrom奖、IEEEMulligan教育奖章和本科生教学奖。由于对RISC技术的贡献,他获得了IEEE技术成就奖和ACMEckert-Mauchly奖;而在RAID方面的贡献为他赢得了IEEEJohnson信息存储奖;他还和Hennessy分享了IEEEJohnvonNeumann奖章和C&C奖金。Patterson作为美国总统信息技术顾问委员会委员,还曾担任计算机研究协会(CRA)主席和ACM主席。这些杰出的工作使他荣获了ACM和CRA颁发的杰出服务奖。
      JohnL.Hennessy,斯坦福大学的第10任校长,从1977年开始在该校电子工程与计算机系任教。Hennessy教授是IEEE和ACM会士,美国国家工程院、国家科学院和美国哲学院院士,美国艺术与科学院院士。他获得过众多奖项,包括:2001年Eckert-Mauchly奖,以表彰他对RISC技术的贡献;2001年SeymourCray计算机工程奖;2000年与Patterson共同获得IEEEJohnvonNeumann奖章。他还拥有7个荣誉博士学位。1981年,Hennessy在斯坦福大学开始MIPS研究项目,1984年参与创建MIPS计算机系统(现在的MIPS技术公司),开发了一款商用RISC微处理器。除了技术活动与大学工作外,他还是多家创业公司的顾问和投资者。
      王党辉,1975年生于陕西省周至县。2005年获得西北工业大学计算机学院工学博士学位。现为西北工业大学计算机学院副教授。2007年在比利时鲁汶大学和欧洲微电子中心(IMEC)进修,2012~2013年8月在美国匹兹堡大学电子与计算机工程系访问研究。主要研究方向为计算机系统结构、新型存储系统、高可靠计算机系统等。承担“计算机组成原理”“计算机系统结构”“汇编语言与接口技术”等课程的教学工作。
      康继昌,1930年生于上海市。1951年毕业于交通大学电机工程系。历任哈尔滨军事工程学院讲师、副教授,西北工业大学教授、系主任,中国航空学会第二、三届理事,国务院学位委员会一、二、三届学科评议组成员。长期从事机载计算机的研究工作。20世纪60年代初主持研制成功我国一台机载计算机,并得到推广应用。后又主持研制成功多种型号的计算机。
      安建峰,1977年生于河北省保定市。2009年获得西北工业大学计算机学院工学博士学位。现为西北工业大学计算机学院副教授。2010年在比利时鲁汶大学和欧洲微电子中心(IMEC)进修,2014年在新加坡国立大学计算机学院访问研究。主要研究方向为高性能计算机体系结构、嵌入式系统软硬件协同设计、FPGA可重构电路等。承担“计算机组成原理”“计算机系统结构”“SoC设计方法学”等课程的教学工作。 出版者的话本书赞誉译者序前言作者简介第1章 计算机概要与技术11.1 引言11.1.1 计算应用的分类及其特性21.1.2 欢迎来到后PC时代31.1.3 你能从本书学到什么41.2 计算机系统结构中的8个伟大思想61.2.1 面向摩尔定律的设计61.2.2 使用抽象简化设计61.2.3 加速大概率事件61.2.4 通过并行提高性能71.2.5 通过流水线提高性能71.2.6 通过预测提高性能71.2.7 存储器层次71.2.8 通过冗余提高可靠性71.3 程序概念入门71.4 硬件概念入门101.4.1 显示器111.4.2 触摸屏121.4.3 打开机箱121.4.4 数据安全151.4.5 与其他计算机通信161.5 处理器和存储器制造技术171.6 性能201.6.1 性能的定义201.6.2 性能的度量221.6.3 CPU性能及其因素231.6.4 指令的性能241.6.5 经典的CPU性能公式251.7 功耗墙271.8 沧海巨变:从单处理器向多处理器转变291.9 实例:Intel Core i7基准311.9.1 SPEC CPU基准测试程序311.9.2 SPEC功耗基准测试程序321.10 谬误与陷阱331.11 本章小结351.12 历史观点和拓展阅读361.13 练习题36第2章 指令:计算机的语言402.1 引言402.2 计算机硬件的操作432.3 计算机硬件的操作数442.3.1 存储器操作数452.3.2 常数或立即数操作数472.4 有符号数和无符号数482.5 计算机中指令的表示532.6 逻辑操作582.7 决策指令602.7.1 循环612.7.2 case/switch语句632.8 计算机硬件对过程的支持642.8.1 使用更多的寄存器662.8.2 嵌套过程672.8.3 在栈中为新数据分配空间692.8.4 在堆中为新数据分配空间702.9 人机交互722.10 MIPS中32位立即数和寻址752.10.1 32位立即数752.10.2 分支和跳转中的寻址762.10.3 MIPS寻址模式总结782.10.4 机器语言解码792.11 并行与指令:同步812.12 翻译并执行程序832.12.1 编译器832.12.2 汇编器842.12.3 链接器852.12.4 加载器872.12.5 动态链接库872.12.6 启动一个Java程序892.13 以一个C排序程序作为完整的例子902.13.1 swap过程902.13.2 sort过程912.14 数组与指针962.14.1 用数组实现clear962.14.2 用指针实现clear972.14.3 比较两个版本的clear972.15 高级内容:编译C语言和解释Java语言982.16 实例:ARMv7(32位)指令集982.16.1 寻址模式992.16.2 比较和条件分支1002.16.3 ARM的特色1002.17 实例:x86指令集1022.17.1 Intel x86的改进1022.17.2 x86寄存器和数据寻址模式1032.17.3 x86整数操作1052.17.4 x86指令编码1072.17.5 x86总结1082.18 实例:ARMv8(64位)指令集1082.19 谬误与陷阱1092.20 本章小结1102.21 历史观点和拓展阅读1112.22 练习题112第3章 计算机的算术运算1173.1 引言1173.2 加法和减法1173.3 乘法1213.3.1 顺序的乘法算法和硬件1213.3.2 有符号乘法1243.3.3 更快速的乘法1243.3.4 MIPS中的乘法1243.3.5 小结1253.4 除法1253.4.1 除法算法及其硬件结构1253.4.2 有符号除法1283.4.3 更快速的除法1283.4.4 MIPS中的除法1293.4.5 小结1293.5 浮点运算1303.5.1 浮点表示1313.5.2 浮点加法1353.5.3 浮点乘法1383.5.4 MIPS中的浮点指令1393.5.5 算术精确性1453.5.6 小结1463.6 并行性和计算机算术:子字并行1483.7 实例:x86中流处理SIMD扩展和高级向量扩展1493.8 加速:子字并行和矩阵乘法1503.9 谬误与陷阱1533.10 本章小结1553.11 历史观点和拓展阅读1583.12 练习题159第4章 处理器1624.1 引言1624.2 逻辑设计的一般方法1654.3 建立数据通路1674.4 一个简单的实现机制1734.4.1 ALU控制1734.4.2 主控制单元的设计1754.4.3 为什么不使用单周期实现方式1814.5 流水线概述1824.5.1 面向流水线的指令集设计1864.5.2 流水线冒险1864.5.3 对流水线概述的小结1914.6 流水线数据通路及其控制1924.6.1 图形化表示的流水线2004.6.2 流水线控制2034.7 数据冒险:旁路与阻塞2064.8 控制冒险2144.8.1 假定分支不发生2154.8.2 缩短分支的延迟2154.8.3 动态分支预测2164.8.4 流水线小结2204.9 异常2214.9.1 MIPS体系结构中的异常处理2214.9.2 在流水线实现中的异常2224.10 指令级并行2264.10.1 推测的概念2274.10.2 静态多发射处理器2274.10.3 动态多发射处理器2314.10.4 能耗效率与高级流水线2334.11 实例:ARM Cortex-A8和Intel Core i7流水线2344.11.1 ARM Cortex-A82354.11.2 Intel Core i7 9202364.11.3 Intel Core i7 920的性能2384.12 运行更快:指令级并行和矩阵乘法2404.13 高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例2424.14 谬误与陷阱2424.15 本章小结2434.16 历史观点和拓展阅读2434.17 练习题243第5章 大容量和高速度:开发存储器层次结构2525.1 引言2525.2 存储器技术2555.2.1 SRAM技术2565.2.2 DRAM技术2565.2.3 闪存2585.2.4 磁盘存储器2585.3 cache的基本原理2595.3.1 cache访问2615.3.2 cache缺失处理2655.3.3 写操作处理2665.3.4 一个cache的例子:内置FastMATH处理器2675.3.5 小结2695.4 cache性能的评估和改进2705.4.1 通过更灵活地放置块来减少cache缺失2725.4.2 在cache中查找一个块2755.4.3 替换块的选择2765.4.4 使用多级cache结构减少缺失代价2775.4.5 通过分块进行软件优化2805.4.6 小结2835.5 可信存储器层次2835.5.1 失效的定义2835.5.2 纠正一位错、检测两位错的汉明编码(SEC/DED)2845.6 虚拟机2875.6.1 虚拟机监视器的必备条件2895.6.2 指令集系统结构(缺乏)对虚拟机的支持2895.6.3 保护和指令集系统结构2895.7 虚拟存储器2905.7.1 页的存放和查找2935.7.2 缺页故障2945.7.3 关于写2975.7.4 加快地址转换:TLB2975.7.5 集成虚拟存储器、TLB和cache 3005.7.6 虚拟存储器中的保护3025.7.7 处理TLB缺失和缺页3035.7.8 小结3075.8 存储器层次结构的一般框架3095.8.1 问题1:一个块可以被放在何处3095.8.2 问题2:如何找到一个块3105.8.3 问题3:当cache缺失时替换哪一块3115.8.4 问题4:写操作如何处理3115.8.5 3C:一种理解存储器层次结构行为的直观模型3125.9 使用有限状态机来控制简单的cache3145.9.1 一个简单的cache3145.9.2 有限状态机3155.9.3 一个简单的cache控制器的有限状态机3165.10 并行与存储器层次结构:cache一致性3175.10.1 实现一致性的基本方案3185.10.2 监听协议3195.11 并行与存储器层次结构:冗余廉价磁盘阵列3205.12 高级内容:实现cache控制器3205.13 实例:ARM Cortex-A8和Intel Core i7的存储器层次结构3205.14 运行更快:cache分块和矩阵乘法3245.15 谬误和陷阱3265.16 本章小结3295.17 历史观点和拓展阅读3295.18 练习题329第6章 从客户端到云的并行处理器3406.1 引言3406.2 创建并行处理程序的难点3426.3 SISD、MIMD、SIMD、SPMD和向量机3456.3.1 在x86中的SIMD:多媒体扩展3466.3.2 向量机3466.3.3 向量与标量的对比3476.3.4 向量与多媒体扩展的对比3486.4 硬件多线程3506.5 多核和其他共享内存多处理器3526.6 图形处理单元简介3556.6.1 NVIDIA GPU体系结构简介3566.6.2 NVIDIA GPU存储结构3576.6.3 GPU展望3586.7 集群、仓储级计算机和其他消息传递多处理器3606.8 多处理器网络拓扑简介3636.9 与外界通信:集群网络3666.10 多处理器测试集程序和性能模型3666.10.1 性能模型3686.10.2 Roofline模型3696.10.3 两代Opteron的比较3706.11 实例:评测Intel Core i7 960和NVIDIA Tesla GPU的Roofline模型3736.12 运行更快:多处理器和矩阵乘法3766.13 谬误与陷阱3786.14 本章小结3796.15 历史观点和拓展阅读3816.16 练习题382附录A 汇编器、链接器和SPIM仿真器389附录B 逻辑设计基础437索引494
  • 内容简介:
      《计算机组成与设计:硬件/软件接口(原书第5版)》是计算机组成与设计的经典畅销教材,第5版经过全面更新,关注后PC时代发生在计算机体系结构领域的革命性变革——从单核处理器到多核微处理器,从串行到并行。本书特别关注移动计算和云计算,通过平板电脑、云体系结构以及ARM(移动计算设备)和x86(云计算)体系结构来探索和揭示这场技术变革。  与前几版一样,本书采用MIPS处理器讲解计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能。  《计算机组成与设计:硬件/软件接口(原书第5版)》特点  更新例题、练习题和参考资料,重点关注移动计算和云计算这两个新领域。  涵盖从串行计算到并行计算的革命性变革,第6章专门介绍并行处理器,每章中都涉及并行硬件和软件的相关主题。  全书采用IntelCorei7、ARMCortex-A8和NVIDIAFermiGPU作为实例。  增加“运行更快”这一新实例,说明正确理解硬件技术的重要性,它能使软件性能提高200倍。  讨论并强调计算机体系结构的“8个伟大思想”——通过并行提高性能、通过流水线提高性能、通过预测提高性能、面向摩尔定律的设计、存储器层次、使用抽象简化设计、加速大概率事件和通过冗余提高可靠性。
  • 作者简介:
      DavidA.Patterson,加州大学伯克利分校计算机科学系教授,IEEE和ACM会士,美国国家工程院、国家科学院和美国艺术与科学院院士,美国计算机历史博物馆院士,并入选硅谷工程名人堂。Patterson曾荣获加州大学杰出教学奖、ACMKarlstrom奖、IEEEMulligan教育奖章和本科生教学奖。由于对RISC技术的贡献,他获得了IEEE技术成就奖和ACMEckert-Mauchly奖;而在RAID方面的贡献为他赢得了IEEEJohnson信息存储奖;他还和Hennessy分享了IEEEJohnvonNeumann奖章和C&C奖金。Patterson作为美国总统信息技术顾问委员会委员,还曾担任计算机研究协会(CRA)主席和ACM主席。这些杰出的工作使他荣获了ACM和CRA颁发的杰出服务奖。
      JohnL.Hennessy,斯坦福大学的第10任校长,从1977年开始在该校电子工程与计算机系任教。Hennessy教授是IEEE和ACM会士,美国国家工程院、国家科学院和美国哲学院院士,美国艺术与科学院院士。他获得过众多奖项,包括:2001年Eckert-Mauchly奖,以表彰他对RISC技术的贡献;2001年SeymourCray计算机工程奖;2000年与Patterson共同获得IEEEJohnvonNeumann奖章。他还拥有7个荣誉博士学位。1981年,Hennessy在斯坦福大学开始MIPS研究项目,1984年参与创建MIPS计算机系统(现在的MIPS技术公司),开发了一款商用RISC微处理器。除了技术活动与大学工作外,他还是多家创业公司的顾问和投资者。
      王党辉,1975年生于陕西省周至县。2005年获得西北工业大学计算机学院工学博士学位。现为西北工业大学计算机学院副教授。2007年在比利时鲁汶大学和欧洲微电子中心(IMEC)进修,2012~2013年8月在美国匹兹堡大学电子与计算机工程系访问研究。主要研究方向为计算机系统结构、新型存储系统、高可靠计算机系统等。承担“计算机组成原理”“计算机系统结构”“汇编语言与接口技术”等课程的教学工作。
      康继昌,1930年生于上海市。1951年毕业于交通大学电机工程系。历任哈尔滨军事工程学院讲师、副教授,西北工业大学教授、系主任,中国航空学会第二、三届理事,国务院学位委员会一、二、三届学科评议组成员。长期从事机载计算机的研究工作。20世纪60年代初主持研制成功我国一台机载计算机,并得到推广应用。后又主持研制成功多种型号的计算机。
      安建峰,1977年生于河北省保定市。2009年获得西北工业大学计算机学院工学博士学位。现为西北工业大学计算机学院副教授。2010年在比利时鲁汶大学和欧洲微电子中心(IMEC)进修,2014年在新加坡国立大学计算机学院访问研究。主要研究方向为高性能计算机体系结构、嵌入式系统软硬件协同设计、FPGA可重构电路等。承担“计算机组成原理”“计算机系统结构”“SoC设计方法学”等课程的教学工作。
  • 目录:
    出版者的话本书赞誉译者序前言作者简介第1章 计算机概要与技术11.1 引言11.1.1 计算应用的分类及其特性21.1.2 欢迎来到后PC时代31.1.3 你能从本书学到什么41.2 计算机系统结构中的8个伟大思想61.2.1 面向摩尔定律的设计61.2.2 使用抽象简化设计61.2.3 加速大概率事件61.2.4 通过并行提高性能71.2.5 通过流水线提高性能71.2.6 通过预测提高性能71.2.7 存储器层次71.2.8 通过冗余提高可靠性71.3 程序概念入门71.4 硬件概念入门101.4.1 显示器111.4.2 触摸屏121.4.3 打开机箱121.4.4 数据安全151.4.5 与其他计算机通信161.5 处理器和存储器制造技术171.6 性能201.6.1 性能的定义201.6.2 性能的度量221.6.3 CPU性能及其因素231.6.4 指令的性能241.6.5 经典的CPU性能公式251.7 功耗墙271.8 沧海巨变:从单处理器向多处理器转变291.9 实例:Intel Core i7基准311.9.1 SPEC CPU基准测试程序311.9.2 SPEC功耗基准测试程序321.10 谬误与陷阱331.11 本章小结351.12 历史观点和拓展阅读361.13 练习题36第2章 指令:计算机的语言402.1 引言402.2 计算机硬件的操作432.3 计算机硬件的操作数442.3.1 存储器操作数452.3.2 常数或立即数操作数472.4 有符号数和无符号数482.5 计算机中指令的表示532.6 逻辑操作582.7 决策指令602.7.1 循环612.7.2 case/switch语句632.8 计算机硬件对过程的支持642.8.1 使用更多的寄存器662.8.2 嵌套过程672.8.3 在栈中为新数据分配空间692.8.4 在堆中为新数据分配空间702.9 人机交互722.10 MIPS中32位立即数和寻址752.10.1 32位立即数752.10.2 分支和跳转中的寻址762.10.3 MIPS寻址模式总结782.10.4 机器语言解码792.11 并行与指令:同步812.12 翻译并执行程序832.12.1 编译器832.12.2 汇编器842.12.3 链接器852.12.4 加载器872.12.5 动态链接库872.12.6 启动一个Java程序892.13 以一个C排序程序作为完整的例子902.13.1 swap过程902.13.2 sort过程912.14 数组与指针962.14.1 用数组实现clear962.14.2 用指针实现clear972.14.3 比较两个版本的clear972.15 高级内容:编译C语言和解释Java语言982.16 实例:ARMv7(32位)指令集982.16.1 寻址模式992.16.2 比较和条件分支1002.16.3 ARM的特色1002.17 实例:x86指令集1022.17.1 Intel x86的改进1022.17.2 x86寄存器和数据寻址模式1032.17.3 x86整数操作1052.17.4 x86指令编码1072.17.5 x86总结1082.18 实例:ARMv8(64位)指令集1082.19 谬误与陷阱1092.20 本章小结1102.21 历史观点和拓展阅读1112.22 练习题112第3章 计算机的算术运算1173.1 引言1173.2 加法和减法1173.3 乘法1213.3.1 顺序的乘法算法和硬件1213.3.2 有符号乘法1243.3.3 更快速的乘法1243.3.4 MIPS中的乘法1243.3.5 小结1253.4 除法1253.4.1 除法算法及其硬件结构1253.4.2 有符号除法1283.4.3 更快速的除法1283.4.4 MIPS中的除法1293.4.5 小结1293.5 浮点运算1303.5.1 浮点表示1313.5.2 浮点加法1353.5.3 浮点乘法1383.5.4 MIPS中的浮点指令1393.5.5 算术精确性1453.5.6 小结1463.6 并行性和计算机算术:子字并行1483.7 实例:x86中流处理SIMD扩展和高级向量扩展1493.8 加速:子字并行和矩阵乘法1503.9 谬误与陷阱1533.10 本章小结1553.11 历史观点和拓展阅读1583.12 练习题159第4章 处理器1624.1 引言1624.2 逻辑设计的一般方法1654.3 建立数据通路1674.4 一个简单的实现机制1734.4.1 ALU控制1734.4.2 主控制单元的设计1754.4.3 为什么不使用单周期实现方式1814.5 流水线概述1824.5.1 面向流水线的指令集设计1864.5.2 流水线冒险1864.5.3 对流水线概述的小结1914.6 流水线数据通路及其控制1924.6.1 图形化表示的流水线2004.6.2 流水线控制2034.7 数据冒险:旁路与阻塞2064.8 控制冒险2144.8.1 假定分支不发生2154.8.2 缩短分支的延迟2154.8.3 动态分支预测2164.8.4 流水线小结2204.9 异常2214.9.1 MIPS体系结构中的异常处理2214.9.2 在流水线实现中的异常2224.10 指令级并行2264.10.1 推测的概念2274.10.2 静态多发射处理器2274.10.3 动态多发射处理器2314.10.4 能耗效率与高级流水线2334.11 实例:ARM Cortex-A8和Intel Core i7流水线2344.11.1 ARM Cortex-A82354.11.2 Intel Core i7 9202364.11.3 Intel Core i7 920的性能2384.12 运行更快:指令级并行和矩阵乘法2404.13 高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例2424.14 谬误与陷阱2424.15 本章小结2434.16 历史观点和拓展阅读2434.17 练习题243第5章 大容量和高速度:开发存储器层次结构2525.1 引言2525.2 存储器技术2555.2.1 SRAM技术2565.2.2 DRAM技术2565.2.3 闪存2585.2.4 磁盘存储器2585.3 cache的基本原理2595.3.1 cache访问2615.3.2 cache缺失处理2655.3.3 写操作处理2665.3.4 一个cache的例子:内置FastMATH处理器2675.3.5 小结2695.4 cache性能的评估和改进2705.4.1 通过更灵活地放置块来减少cache缺失2725.4.2 在cache中查找一个块2755.4.3 替换块的选择2765.4.4 使用多级cache结构减少缺失代价2775.4.5 通过分块进行软件优化2805.4.6 小结2835.5 可信存储器层次2835.5.1 失效的定义2835.5.2 纠正一位错、检测两位错的汉明编码(SEC/DED)2845.6 虚拟机2875.6.1 虚拟机监视器的必备条件2895.6.2 指令集系统结构(缺乏)对虚拟机的支持2895.6.3 保护和指令集系统结构2895.7 虚拟存储器2905.7.1 页的存放和查找2935.7.2 缺页故障2945.7.3 关于写2975.7.4 加快地址转换:TLB2975.7.5 集成虚拟存储器、TLB和cache 3005.7.6 虚拟存储器中的保护3025.7.7 处理TLB缺失和缺页3035.7.8 小结3075.8 存储器层次结构的一般框架3095.8.1 问题1:一个块可以被放在何处3095.8.2 问题2:如何找到一个块3105.8.3 问题3:当cache缺失时替换哪一块3115.8.4 问题4:写操作如何处理3115.8.5 3C:一种理解存储器层次结构行为的直观模型3125.9 使用有限状态机来控制简单的cache3145.9.1 一个简单的cache3145.9.2 有限状态机3155.9.3 一个简单的cache控制器的有限状态机3165.10 并行与存储器层次结构:cache一致性3175.10.1 实现一致性的基本方案3185.10.2 监听协议3195.11 并行与存储器层次结构:冗余廉价磁盘阵列3205.12 高级内容:实现cache控制器3205.13 实例:ARM Cortex-A8和Intel Core i7的存储器层次结构3205.14 运行更快:cache分块和矩阵乘法3245.15 谬误和陷阱3265.16 本章小结3295.17 历史观点和拓展阅读3295.18 练习题329第6章 从客户端到云的并行处理器3406.1 引言3406.2 创建并行处理程序的难点3426.3 SISD、MIMD、SIMD、SPMD和向量机3456.3.1 在x86中的SIMD:多媒体扩展3466.3.2 向量机3466.3.3 向量与标量的对比3476.3.4 向量与多媒体扩展的对比3486.4 硬件多线程3506.5 多核和其他共享内存多处理器3526.6 图形处理单元简介3556.6.1 NVIDIA GPU体系结构简介3566.6.2 NVIDIA GPU存储结构3576.6.3 GPU展望3586.7 集群、仓储级计算机和其他消息传递多处理器3606.8 多处理器网络拓扑简介3636.9 与外界通信:集群网络3666.10 多处理器测试集程序和性能模型3666.10.1 性能模型3686.10.2 Roofline模型3696.10.3 两代Opteron的比较3706.11 实例:评测Intel Core i7 960和NVIDIA Tesla GPU的Roofline模型3736.12 运行更快:多处理器和矩阵乘法3766.13 谬误与陷阱3786.14 本章小结3796.15 历史观点和拓展阅读3816.16 练习题382附录A 汇编器、链接器和SPIM仿真器389附录B 逻辑设计基础437索引494
查看详情
系列丛书 / 更多
计算机组成与设计(原书第5版):硬件/软件接口
Java编程思想(第4版)
[美]Bruce Eckel 著;陈昊鹏 译
计算机组成与设计(原书第5版):硬件/软件接口
数据挖掘:概念与技术(原书第3版)
[美]Jiawei、[美]Micheling、[美]Jian Pei 著;范明、孟小峰 译
计算机组成与设计(原书第5版):硬件/软件接口
算法导论(原书第3版)
[美]Thomas、[美]Charles、[美]Ronald、[美]Clifford Stein 著;殷建平、徐云、王刚 译
计算机组成与设计(原书第5版):硬件/软件接口
数据结构与算法分析:Java语言描述
[美]马克·艾伦·维斯 著;陈越 译
计算机组成与设计(原书第5版):硬件/软件接口
C程序设计语言(第2版·新版) 习题解答
吉米拜尔 著;杨涛 译;[美]汤朵
计算机组成与设计(原书第5版):硬件/软件接口
C程序设计语言(第二版)
[美]Brian(布莱恩·克尼汉)、[美]Dennis M.Ritchie(丹尼斯·里奇) 著;徐宝文、李志 译
计算机组成与设计(原书第5版):硬件/软件接口
计算机科学丛书·云计算:概念、技术与架构
[美]Thomas、[英]Zaigham、[巴西]Ricardo Puttini 著;龚奕利、贺莲、胡创 译
计算机组成与设计(原书第5版):硬件/软件接口
深入理解计算机系统(原书第3版)
[美]兰德尔 E.布莱恩特(Randal E.·Bryant) 著;龚奕利、贺莲 译
计算机组成与设计(原书第5版):硬件/软件接口
计算机科学导论:原书第3版
[美]Behrouz Forouzan 著;刘艺 译
计算机组成与设计(原书第5版):硬件/软件接口
数据库系统概念:(原书第6版)
[美]Abraham、Henry、S.Sudarshan 著;杨冬青、李红燕、唐世渭 译
计算机组成与设计(原书第5版):硬件/软件接口
编译原理:原理、技术与工具
[美]阿霍 著;赵建华 译
计算机组成与设计(原书第5版):硬件/软件接口
软件工程:实践者的研究方法(原书第8版 本科教学版)
[美]罗杰 S. 普莱斯曼 著;郑人杰、马素霞 译
相关图书 / 更多
计算机组成与设计(原书第5版):硬件/软件接口
计算机基础与实训教程
顾玲芳 编
计算机组成与设计(原书第5版):硬件/软件接口
计算机网络攻击与防护
刘念;陈雪松;谈洪磊
计算机组成与设计(原书第5版):硬件/软件接口
计算机组成原理与汇编语言
田民格、秦彩杰、林观俊、田佳琪
计算机组成与设计(原书第5版):硬件/软件接口
计算天文
冯毅
计算机组成与设计(原书第5版):硬件/软件接口
计算思维培养与无人机创意编程
范谊 陈宇 张锦东
计算机组成与设计(原书第5版):硬件/软件接口
计算机组成原理与系统结构(第3版)
冯建文 章复嘉 赵建勇 包健 编著
计算机组成与设计(原书第5版):硬件/软件接口
计算小状元 小学数学 2年级上册 bs版 小学数学单元测试 新华
作者
计算机组成与设计(原书第5版):硬件/软件接口
计算机应用基础
苗苗
计算机组成与设计(原书第5版):硬件/软件接口
计算机系统原理(2023年版) 全国高等教育自学考试指导委员会
全国高等教育自学考试指导委员会
计算机组成与设计(原书第5版):硬件/软件接口
计算机组装与维护(第3版高等院校计算机应用技术规划教材)
孙中胜 编
计算机组成与设计(原书第5版):硬件/软件接口
计算机辅助翻译教程()
赵秋荣
计算机组成与设计(原书第5版):硬件/软件接口
计算机三维建模方法
易健宏 编著;李凤仙
您可能感兴趣 / 更多
计算机组成与设计(原书第5版):硬件/软件接口
宇宙视觉史:从宇宙大爆炸到时间的尽头
[美]查尔斯·刘 著;高爽 译者;[美]马克西姆· 马洛维奇科 绘;未读 出品
计算机组成与设计(原书第5版):硬件/软件接口
写出我心 普通人如何通过写作表达自己(平装本)
[美]娜塔莉·戈德堡(Natalie Goldberg)
计算机组成与设计(原书第5版):硬件/软件接口
写出我心3 写作疗愈的真正秘密
[美]娜塔莉·戈德堡(Natalie Goldberg)
计算机组成与设计(原书第5版):硬件/软件接口
神套路:为什么我们总被带节奏(狂热与网红时代醍醐灌顶之作,教给普通人安身立命的不二法门!)
[美]阿里·阿莫萨维 著;[哥伦比亚]亚历杭德罗·希拉尔多 绘
计算机组成与设计(原书第5版):硬件/软件接口
阿伦森自传
[美]埃利奥特·阿伦森(Elliot Aronson) 著;沈捷 译;湛庐文化 出品
计算机组成与设计(原书第5版):硬件/软件接口
街头官僚:公共服务中的个人困境
[美]迈克尔·李普斯基(Michael Lipsky)
计算机组成与设计(原书第5版):硬件/软件接口
史前至蒙古帝国时期的内欧亚大陆史
[美]大卫·克里斯蒂安 著;潘玲 译;杨建华 校
计算机组成与设计(原书第5版):硬件/软件接口
意大利文艺复兴新艺术史
[美]迈克尔·韦恩·科尔 著;[美]斯蒂芬·J·坎贝尔;邵亦杨
计算机组成与设计(原书第5版):硬件/软件接口
老人与海 彩图注音版 一二三四年级5-6-7-8-9岁小学生课外阅读经典 儿童文学无障碍有声伴读世界名著童话故事
[美]海明威
计算机组成与设计(原书第5版):硬件/软件接口
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
[美]凯文·莱曼 著;唐晓璐 译;斯坦威 出品
计算机组成与设计(原书第5版):硬件/软件接口
自律我也能做到(全9册)
[美]康妮·科维尔·米勒 著;[阿根廷]维多利亚·阿萨纳利 绘
计算机组成与设计(原书第5版):硬件/软件接口
你在等什么?
[美]斯科特·明钦 著;[中]易万 译;[美]马特 ·斐兰 绘