计算机组织结构 期中复习

2019-08-20 19:16

计算机组织结构

Ⅰ Introduction 总述

结构 architecture 对程序员可见(程序员必须清楚) 包括:指令集、各种数据类型的大小 组织 organization(内部实现) 对程序员透明(程序员没有必要清楚) 包括:控制信号、存储技术 计算机发展史:

第一代 电子管/真空管 ENIAC 十进制

IAS

二进制 存储程序思想

亦叫做冯诺依曼模型 分为

? Central Arithmetical (CA) 运算器 ? Central Control (CC) 控制器 ? Memory (M) 存储器

? Input (I) / Output (O) 输入输出

四部分组成

第二代 晶体管

第三代到N代 集成电路

摩尔定律(Moore's law):

在一个芯片上所放的晶体管数目每年翻倍(69年前)/18个月翻倍(69年后)

说明计算机逻辑内存单元制作更加便宜/会变得更小/提高了运算速度/降低了电源和散热要求/

集成电路的可靠性更高 计算机性能:

CPU:速度

Memory:容量/速度

I/O:容量/速度

主要目的是提高CPU速度

CPU的性能:

时钟: 时钟率(Hz):每秒能处理的基本指令

时钟周期(s):1/时钟率 Clock tick?

指令处理 每秒钟执行的百万指令数(MIPS) 每秒百万个浮点操作指令数(MFLOPS)

例题:

1. 在逛商店时,你听到一位顾客问店主,他在商店里能买到的最快的计算机是什么。店主回答说“你正在看的是Macintosh,最快的Mac机以1.2GHz时钟速率运行,如果你想要最快的机器,你应该购买我们的2.4GHz的Intel Pentium 4计算机。”店主的说法对吗?为什么?

解: 不能依靠时钟频率来衡量一台计算机的性能,更科学的衡量标准是每秒所执行的浮点数计算有多少百万次。

相同的功能在不同的指令集中需要的指令数量是不同的,同一条指令在不同计算机上需要的时钟周

期是不同的。而且,即便在指令相同的情况下,如果采用并行或者流水线等技术,也可以加速程序的执行 2. ENIAC是一个十进制机器,用10个真空管来代表一个寄存器。任何时刻只有一个真空管处于ON状态,表示10个数字中的一个。假定,ENIAC有能力使多个真空管同时处于ON和OFF态,这种表示方法是否合理?为什么?

不合理,当ENIAC有能力使得多个真空管同时处于ON或者OFF状态,应该采用二进制,可以减

少所需要的真空管数量,而且如果10个真空管中出现了多个处于ON状态,则会无法判断是哪个数字。 3. IBM 360Model 75的指令周期的时间是360Model 30的5倍,而相对性能确提高为原来的50倍。为什么会出现这种现象?

计算机系统性能衡量的常用标准是每秒进行多少百万次的浮点数运算,虽然IBM 360Model 75的

指令周期是360Model 30的5倍,但它可能采用不同的指令集使得完成相同功能的指令数目减少,或者采用了流水线、并行等技术,使得计算机的性能得到了提高。

4. 时钟以固定频率f(或等价地说,以固定周期时间t)来驱动处理器,这里t=1/f。程序的规模能用程序所包含的机器指令数,或者指令计数IC来衡量。不同的指令会要求不同的时钟周期数来执行。一个重要参数是程序的平均每条指令周期数(average cycles per instruction,CPI)。执行一个给定程序所需的处理器时间能表示成: T=IC×CPI×t

在指令执行期间处理器只是做了部分工作,一部分时间是花费在处理器与存储器之间的字传送上。在后一种情况下,传送时间取决于存储器周期时间,而它会比处理器周期大很多。我们能将上面等式改写成: T=IC×[p+(m×k)]×t

这里,p 是用于译码和执行指令所需的处理器周期数,m 是所需的存储器访问次数,k是存储器周期时间和处理器周期时间之比。

上面等式中5个性能因子(IC,p,m,k,t)受到4个系统属性影响:(1)指令集设计(亦称指令集体系结构);(2)编译技术(在由高级语言程序产生机器语言程序时编译器如何有效);(3)处理器实现;(4)Cache和存储器的层次。 请用表格形式说明这4个系统属性对这5个性能因子的影响。

指令集规模小 编译技术好

IC P M K T

变多 变多 变多

变少 变少 变少

处理器快 无影响 无影响 无影响 变大 变小

存储层次多 无 影响 无影响 变多 变小 无影响

无影响 无影响

无影响 无影响

5. 处理器性能的一个普通度量是指令执行的速率,表示为每秒百万条指令(MIPS)。请用时钟速率和CPI来表示MIPS速率。

解:设时钟频率为f,平均每条指令周期数为CPI. 所以平均每条指令所需要的时间为CPI/f

1/(CPI/f)*10^6=f/CPI*10^-6 即每秒指令的百万条指令数

6. 一个测试程序在一个40MHz的处理器上运行,其目标代码有100000条指令,由如下各 类指令及其时钟周期计数混合组成:

请确定这个程序的有效CPI、MIPS速率和执行时间。

CPI=(45000+32000*2+15000*2+8000*2)/(45000+32000+15000+8000) MIPS=f/CPI*10^-6 T=100000/MIPS

Ⅱ A Top-Level View of Computer Function and Interconnection 总观计算机功能及内部联系

冯诺依曼模型(the von Neumann machine):

计算机组成:

I/O

主存(Main memory)

CPU

顺序执行指令

系统总线(System bus)

内存: 数据和指令被存贮在内存中 I/O:

内存中的数据按地址寻找

问题: 主存与CPU之间的传输速度差距越来越大 解决: 包含寄存器(cache)缓冲数据减少对内存访问量

增加每次读取的字节数

和CPU/内存交换数据

问题: 和CPU/内存的速度差距越来越大 解决: 缓冲

新的接口技术

按地址寻找数据

CPU: 顺序执行指令 数据和指令被存贮在内存中

问题: 等待I/O设备时CPU的空闲问题 解决: 中断(Interrupt):

嵌套中断处理(Nested interrupt processing)

总线:

连续中断处理(Sequential interrupt processing)

是一种共用的传输介质

链接两个或更多设备

数据传输类型: 地址线 数据线 控制线 总线类型:专用总线(高效传输/规模成本高)

复用总线(节省空间和成本/复杂的机制)

总线仲裁:总线可被多个设备监听但每次只能由其中一个发出信息

集中式/分布式


计算机组织结构 期中复习.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:国培计划2013年甘肃省初中综合实践课程远程培训心得体会1

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: