计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录(2)

2019-02-21 00:44

例1.2,p10

采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20%。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计方案。 解:分别计算出这两种设计方案所能得到的加速比:

STo1n?T? n(1?Fe)?FeSeFe FPSQR=0.20,Se FPSQR=10 Fe FP=0.50,Se FP=2

Sn1FPSQR??1(1?0.2)?0.20.82?1.2210Sn11

FP??(1?0.5)?0.50.75?1.332

6

例1.3,p11

如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%, FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。 解:

CPI??n(CPIIii?i?1IC) 原系统的

CPIIFP=4.0, FPIC=25% CPII2=1.33, 2IC=1-25%

nCPII原 ??(CPIii?IC) i?1= CPIIFP

FP + CPII22ICIC =4.0×25% + 1.33×75%

7

=2

方案1(使FPSQR操作的CPI为2)系统 CPI=CPI原 - CPIIFPSQRFPSQR原

IC + CPIIFPSQRFPSQR新

IC

=CPI原 -

IFPSQRIC(CPIFPSQR原 - CPIFPSQR新)

=2-2%×(20-2) =1.64

方案2(提高所有FP指令的处理速度, 使FPSQR操作的CPI为2)CPI=CPII原 - CPIFP原FPIC + CPIIFP新FPIC =CPII原 -

FPIC(CPIFP原 - CPIFP新) =2-25% ×(4-2) =1.5

我们也可以根据以下公式计算出方案2系统(同求CPI原) CPI= 75%×1.33+25%×2=1.5

8

显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。 方案2的加速比 加速比?采用改进措施后的性能

没有采用改进措施前的性能Sn?ToCPU时间原系统 ?TnCPU时间方案2??IC ? 时钟周期 ? CPI原系统

IC ? 时钟周期 ? CPI方案2CPI原系统

CPI方案2=2/1.5 =1.33

例1.4

假设两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其它指令只需1个时钟周期。

CPUA:采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行

9

测试,以确定是否进行转移。显然实现一次条件转移要执行比较和测试两条指令。条件转移指令占总执行指令条数的20%。由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。

CPUB采用比较功能和判别是否实现转移功能合在一条指令的方法,这样实现一条件转移就只需一条指令就可以完成。由于CPUB在转移指令中包含了比较功能,因此它的时钟周期就比CPUA要慢25%。

现在要问,采用不同转移指令方案的CPUA和CPUB,那个工作速度会更快些?解:

CPIA=0.2×2+0.8×1=1.2 TCPUA=ICA×1.2×tA = 1.2 ICA×tA

CPUB转移指令占20%÷80%=25% CPIB = 0.25×2+0.75×1=1.25 由于CPUB中没有比较指令,因此 ICB = 0.8×ICA

CPUB时钟周期就比CPUA要慢25% tB = 1.25tA

TCPUB = ICB×CPIB×tB

= 0.8 ICA×1.25×1.25tA

10


计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:全程编制棉业机械项目可行性研究报告方案(可用于发改委立项及银

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: