计算机系统结构总复习题 - 图文(8)

2019-01-04 22:59

Cache中

1 1 1 1 1 1 1 1 1 1 4 4 4 4 4

块分配情况 操作状态

- - 4 4 4 4 0 0 0 5 5 5 5 5 5 - 2 2 2 2 7 7 7 7 7 7 6 6 6 2 - - - - 3 3 3 3 2 2 2 2 2 7 7 调调调命调替替命替替替替命替替进 进 进 中 进 换 换 中 换 换 换 换 中 换 换

(3)在第14和15次访问块时产生块失效又发生块争用现象。 2分 (4)命中率:Hc=3/15=20% 2分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:603 2、题型:计算题 3、难度级别:3

4、知识点:五、存储层次 5、分值:10

6、所需时间:15分钟

7、试题关键字:平均访存时间 8、试题内容:

假设Cache的命中时间为1个时钟周期,失效开销为50 个时钟周期,在混合Cache中一次load或store操作访问Cache的命中时间都要增加一个时钟周期(因为混合Cache只有一个端口,无法同时满足两个请求,混合Cache会导致结构冲突),根据下表所列的失效率,试问指令Cache和数据Cache容量均为16KB的分离Cache和容量为32KB的混合Cache相比,哪种Cache的失效率更低?又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。请问上述两种情况下平均访存时间各是多少?

表1 指令Cache、数据Cache和混合Cache失效率的比较 容 量 指令 Cache 数据 Cache 混合 Cache 1 KB 3.06% 24.61% 13.34% 2 KB 2.26% 20.57% 9.78% 4 KB 1.78% 15.94% 7.24% 8 KB 1.10% 10.19% 4.57% 16 KB 0.64% 6.47% 2.87% 32 KB 0.39% 4.82% 1.99% 64 KB 0.15% 3.77% 1.36% 128 KB 0.02% 2.88% 0.95% 9、答案内容: 解:

如前所述,约75%的访存为取指令。因此,分离Cache的总体失效率为: (75%×0.64%)+(25%×6.47%)=2.10% 2分

根据表1容量为32KB的混合Cache的失效率略低一些,只有1.99%。 1

平均访存时间公式可以分为指令访问和数据访问两部分:

平均访存时间=指令所占的百分比× (指令命中时间+指令失效率×失效开销)+数据所占的百分比× (数据命中时间+数据失效率×失效开销) 2分 所以,两种结构的平均访存时间分别为:

平均访存时间分离=75%×(1+0.64%×50)+25%×(1+6.47%×50)

=(75%×1.32)+(25%×4.325)=0.990+1.059=2.05 2分

平均访存时间混合=75%×(1+1.99%×50)+25%×(1+1+1.99%×50)

=(75%×1.995)+(25%×2.995)=1.496+0.749=2.24 2分 故,尽管分离Cache的实际失效率比混合Cache的高,但其平均访存时间反而较低。 1分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:604 2、题型:计算题 3、难度级别:4

4、知识点:五、存储层次 5、分值:10

6、所需时间:15分钟

7、试题关键字:Cache失效开销 8、试题内容:

假设Cache失效开销为50个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2.0个时钟周期, Cache的失效率为2%,平均每条指令访存1.33次。试分析Cache对性能的影响。 9、答案内容:

解:CPU 时间=IC×(CPIexe+存储器停顿周期数/指令数)×时钟周期时间 2分

考虑Cache的失效后,性能为:

CPU 时间有cache=IC×(2.0+(1.33×2%×50))×时钟周期时间 =IC×3.33×时钟周期时间 4分 实际CPI :3.33

3.33/2.0 = 1.67(倍) 2分

CPU时间也增加为原来的1.67倍。但若不采用Cache,则: CPI=2.0+50×1.33=68.5 2分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:605 2、题型:计算题 3、难度级别:4

4、知识点:五、存储层次

5、分值:10

6、所需时间:15分钟 7、试题关键字:CPU性能 8、试题内容:

考虑两种不同组织结构的Cache:直接映象Cache和两路组相联Cache,试问它们对CPU的性能有何影响?先求平均访存时间,然后再计算CPU性能。分析时请用以下假设:

⑴理想Cache(命中率为100%)情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.3次。

⑵两种Cache容量均为64KB,块大小都是32字节。 ⑶在两路组相联Cache中,我们必须增加一个多路选择器,用于根据标识匹配结果从相应组的块中选择所需的数据。因为CPU的速度直接与Cache命中的速度紧密相关,所以对于组相联Cache,由于多路选择器的存在而使CPU的时钟周期增加到原来的1.10倍。

⑷这两种结构Cache的失效开销都是70ns。在实际应用中,应取整为整数个时钟周期。

⑸命中时间为1个时钟周期,64KB直接映象Cache的失效率为1.4%,相同容量的两路组相联Cache的失效率为1.0%。 9、答案内容: 解:由:

平均访存时间=命中时间+失效率×失效开销 1分 得: 平均访存时间1路=2.0+(0.014×70)=2.98ns

平均访存时间2路=2.0×1.10+(0.010×70)=2.90ns 2分 两路级相联Cache的平均访存时间比较低。 1分 由: CPU 时间=IC×(CPIexe+每条指令的平均存储器停顿周期数)×时钟周期时间 =IC ×(CPIexe×时钟周期时间+每条指令的平均存储器停顿时间) 3分 得:

CPU时间1路=IC×(2.0×2+(1.3×0.014×70))=5.27×IC

CPU时间2路=IC×(2.0×2×1.10+(1.3×0.010×70))=5.31×IC 2分 相对性能比为:

CPU时间2路/CPU时间1路=5.31×IC/5.27×IC=1.01 1分 10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:606 2、题型:计算题 3、难度级别:3

4、知识点:五、存储层次 5、分值:10

6、所需时间:15分钟

7、试题关键字:存储器性能 8、试题内容:

给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?

(1) 理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存

1.2次;

(2) 两者Cache容量均为64KB,块大小都是32字节;

(3) 组相联Cache中的多路选择器使CPU的时钟周期增加了10%; (4) 这两种Cache的失效开销都是80ns; (5) 命中时间为1个时钟周期;

(6) 64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失

效率为10%。 9、答案内容:

解: 平均访问时间=命中时间+失效率×失效开销 1分

平均访问时间1-路=2.0+1.4% *80=3.12ns

平均访问时间2-路=2.0*(1+10%)+1.0% *80=3.0ns 两路组相联的平均访问时间比较低。 3分 CPUtime=(CPU执行+存储等待周期)*时钟周期

CPU time=IC(CPI执行+总失效次数/指令总数*失效开销) *时钟周期 =IC((CPI执行*时钟周期)+(每条指令的访存次数*失效率*失效开销*时钟周期)) 2分

CPU time 1-way=IC(2.0*2+1.2*0.014*80)=5.344IC

CPU time 2-way=IC(2.2*2+1.2*0.01*80)=5.36IC 2分

相对性能比:

CPUtime?2wayCPUtime?1way?5.36/5.344=1.003 1分

直接映象cache的访问速度比两路组相联cache要快1.04倍,而两路组相联Cache的平均性能比直接映象cache要高1.003倍。因此这里选择两路组相联。 1分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:607 2、题型:计算题 3、难度级别:3

4、知识点:五、存储层次 5、分值:10

6、所需时间:15分钟

7、试题关键字:cache性能 8、试题内容:

假设一台计算机具有以下特性: (1) 95%的访存在Cache中命中;

(2) 块大小为两个字,且失效时整个块被调入; (3) CPU发出访存请求的速率为109字/秒; (4) 25%的访存为写访问;

(5) 存储器的最大流量为109字/秒(包括读和写);

(6) 主存每次只能读或写一个字;

(7) 在任何时候,Cache中 有30%的块被修改过; (8) 写失效时,Cache采用写分配法。

现欲给计算机增添一台外设,为此想先知道主存的频带已经使用了多少。试对于以下两种情况计算主存频带的平均使用比例。 (1) 写直达Cache; (2) 写回法Cache。 9、答案内容: 解:采用按写分配

(1)写直达cache访问命中,有两种情况:

读命中,不访问主存;

写命中,更新cache和主存,访问主存一次。 访问失效,有两种情况:

读失效,将主存中的块调入cache中,访问主存两次;

写失效,将要写的块调入cache,访问主存两次,再将修改的数据写入cache和主存,访问主存一次,共三次。上述分析如下表所示。3分

访问命中 Y Y N N 访问类型 读 写 读 写 频 率 95%*75%=71.3% 95%*25%=23.8% 5%*75%=3.8% 5%*25%=1.3% 访存次数 0 1 2 3 一次访存请求最后真正的平均访存次数

=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)=0.35

已用带宽=0.35×109/10 9 =35.0% 2分

(2)写回法cache访问命中,有两种情况:

读命中,不访问主存;

写命中,不访问主存。采用写回法,只有当修改的cache块被换出时,才写入主存;

访问失效,有一个块将被换出,这也有两种情况:

如果被替换的块没有修改过,将主存中的块调入cache块中,访问主存两次; 如果被替换的块修改过,则首先将修改的块写入主存,需要访问主存两次;然后将主存中的块调入cache块中,需要访问主存两次,共四次访问主存。3分

访问命中 Y Y N N

所以:

一次访存请求最后真正的平均访存次数 =66.5%*0+28.5%*0+3.5%*2+1.5%*4=0.13

块为脏 N Y N Y 频 率 95%*70%=66.5% 95%*30%=28.5% 5%*70%=3.5% 5%*30%=1.5% 访存次数 0 0 2 4


计算机系统结构总复习题 - 图文(8).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:妇科习题集

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: