第2章 思考与习题参考答案
2-1简述微处理器的主要性能指标,性能公式(2-1)说明了什么? 答:微处理器的主要性能指标如下表所示 性能指标参数 字长 主频 外频 FSB频率 工作电压 制造工艺 地址线宽度 数据线宽度 协处理器 流水线技术 超标量结构 L1/L2/L3 Cache SIMD 核心架构 功耗 含义 内部处理二进制数的位数 处理器核心工作频率 外部总线的核心频率(基准频率) 前端总线频率 处理器核心工作电压 指管子之间的最小线距 处理器外部地址线条数,决定物理地址空间2m 处理器外部数据线条数,决定对外访问能力 是否内置协处理器,性能如何 流水线级数 多条指令流水线,含流水线级数 一级/二级/三级高速缓存 单指令处理多个数据的能力 处理器采用的核心架构类型 反应处理器消耗的功率 功耗=动态电容×电压×电压×频率 示例 8,16,32,64 100MHz,3.2GHz 33MHz,66MHz,100MHz 266MHz,533MHz,800MHz,1330MHz 5V,3V,1.8V,1.2V 0.13μm,90nm,65nm,45nm 20,32,36 8位,16位,32位,64位 X87 5级,12级,14级,20级,31级等 1个,2个,3个,4个,8个 8KB,16KB,512KB,4MB MMX,SSE,SSE2,SSE3,SSSE3,SSE4 P5,P6,NetBurst,Core 50W,25W等 公式(2-1): 性能=核心频率×每个周期执行指令的条数
说明,微处理器的性能的提高不仅取决于工作频率,还依赖每周期执行指令的条数。新的处理器代替老的处理器,就是根据这一性能公式来提高它的性能的。即或单独提高频率,或单独增加每周期执行指令的条数,或既提高频率又增加每周期执行指令的条数。由于核心频率的提高是有限制的,因此从Cure系列开始注重提高每个周期指令执行的条数来提高性能。
答:
1.五种工作方式:实地址方式、保护虚地址方式、虚拟86方式、系统管理方式以及IA-32E方式。 2.含义:
(1)实地址方式是指处理器工作在8086/8088编程环境下的工作方式。
(2)保护地址方式,又称保护虚地址方式,简称保护方式,是真正发挥处理器潜能的一种工作方式。所谓保护是指在执行多任务操作时,对不同任务使用的不同存储空间进行完全隔离,保护每个任务顺利执行。
(3)虚拟86方式是指一个多任务的环境,即模拟多个8086的工作方式。在这个方式之下,处理器被模拟成多个8086微处理器同时工作。
(4) 系统管理方式(SMM)是为实现特定功能及系统安全提供的一种工作方式,SMM的功能主要包括电源管理以及为操作系统和正在运行的程序提供安全性。SMM最显著的应用就是电源管理。
以上四种方式是IA-32所有处理器所具有的工作方式。
(5)从后期的P4到以Core为核心的处理器开始支持64位扩展技术,引入了IA-32E工作方式。在这种方式下,处理器支持两种模式即兼容的工作方式(兼容IA-32处理器的方式)和64位工作方式。在兼容模式下,允许在64位操作系统下运行原来的16位和32位应用程序,采用EM64T技术,支持64位操作,同时支持36位的地址,支持64位线性地址,默认的地址空间为64位,默认的数据宽度为32位,指令允许32/64地址和32/64数据的混合使用,因此又把 Core为核心的处理器称为32/64处理器,与真正64位处理器有区别,可称之为具有64位功能的32位处理器。
3.工作方式的相互转换如下图所示。
2-2简述微处理器的工作方式、各工作方式的含义和区别是什么?它们之间是如何切换的?
思考与习题参考答案
2 《微型计算机及接口技术》 实地址 方式 PE=1 SMI 复位或RSM指令 复位或PE=0 SMI RSM PG=1,LMA=1 保护 系统管理 方式 SMI 复位方式 LMA=0 2-3 IA-32E方式兼容模式和64位模式下,Cure 2 Duo系列处理器能够寻址的物理地址空间分别有多大?为什么把具有IA-32E模式的处理器称为32/64位处理器,而不直接称为64位处理器?
答:
(1)具有IA-32E工作方式处理器在兼容模式下,最大支持的32位地址空间,而在64位方式下,采用EM64T技术,支持64位操作,同时支持36位的物理地址,支持64位线性地址,默认的地址空间为64位。
(2)由于具有IA-32E方式的处理器默认的数据宽度为32位,指令允许32/64地址和32/64数据的混合使用,因此又把 Core为核心的处理器称为32/64处理器,与真正64位处理器有区别,可称之为具有64位功能的32位处理器。
2-4 为什么要引入流水线技术?什么是超标量结构?说明从80486到Cure 2 Quard处理器所具有的指令流水线的条数、级数以及单周期可执行简单指令的条数。
答:引入流水线技术目的就是提高指令的执行效率,超标量结构是指具有两条及以上指令流水线的处理器的结构。从80486到Cure 2 Quard具有的流水线级数、流水线条数及单周期执行简单指令的条数如下表所示。 处理器 流水线级数 流水线个数 单周期执指条数 PentiumII80486 Pentium Pentium Pro PentiumII I 5 1 1 5 2 2 12 3 3 12 3 3 12 3 3 Pentium4 20(478) 31(775) 3(2个倍速) 5 (1+2×2) Cure 2 Duo 14 4×2 8 Cure 2 Quard 14 4×4 16 2-5 到目前为止,Intel基于个人计算机的微处理器有哪些核心架构,其各自的突出特点有哪些? 答: Intel微处理器的核心体系结构:80X86架构(8086/8088、80286、80386和80486)、P5架MMX Pentium)P6架构PentiumⅡ和Pentium Ⅲ)NetBurst架构构(Pentium、、(Pentium Pro、、(Pentium 4)和Core架构(Pentium Dual-Core、Core 2 Duo、Core 2 Quad和Core 2 Extreme等)。
80X86架构基本采用CISC(复杂指令集计算机)技术,从8086/8088内部的2个独立而又相互配合工作的部件,到80286增加到4个部件,开始支持保护方式;进入32位时代,80386内部增加到6个部件,开始虚拟86方式,支持虚拟存储器和,到了80486内部增加到8个部件,开始支持影子内存,并增加了Cache部件和浮点运行部件。处理器内部并行操作的部件不断增多,主频不断提高,新技术不断融入,是不断适应新的要求发展起来的微处理器架构。8086/8088字长是16位的Intel体系结构,而80386和80486却是32位的Intel体系结构,称为IA-32。
P5架构采用RISC与CISC相结合的技术,采用两条指令流水线,外部数据线首次采用64条,数据Cache和指令Cache开始分离,首次采用分支指令预测功能,使效率大大提高。
VM=1 方式 VM=0 IA-32E方式 SMI RSM RSM 虚拟86 国家十一五规划教材《微机原理与接口技术(第二版)》思考题与习题参考答案 3
P6架构采用三条指令流水线,Cache扩大,并引入二级Cache,大大地加快了数据读取和命中率,提高了性能,支持多媒体扩展技术MMX。
NetBurst架构首次采用快速执行引擎,使简单ALU速度加倍,采用超级流水线技术(20级,31级),先进的动态执行,创新的Cache 子系统(Trace Cache上),超标量发射以实现并行性,扩充的可重命名的硬件寄存器,支持更新的多媒体扩展指令等。
Core 微架构拥有双核心、64位指令集、4发射的超标量体系结构(核心特点)和乱序执行机制等技术,支持36位的物理寻址,支持 Intel 所有的扩展指令集。Core 微架构的每个内核拥有L1指令Cache、双端口L1数据Cache,2个内核共同拥有共享式二级缓存。Core架构采用了每条超级指令流水线14级,其流水线效率大幅度提升。全新的整数与浮点单元,Core具备了3个64位的整数执行单元,每一个都可以单独完成的64位整数运算操作,即Core能够在一个周期内同时完成3组64位的整数运算。
2-6 8086/8088微处理器由哪两个关键部分组成,其功能主要包括哪些?说明二者是如何配合工作的。
答:(1)组成:8086/8088由两个既相互独立,又相互配合,并行操作的重要部件组成总线接口部件BIU和执行部件EU组成。
(2)总线接口部件BIU的功能:负责微处理器内部与外部(存储器和I/O接口)的信息传递。BIU完成的主要任务包括:取指令、传送数据以及计算物理地址;执行部件EU的功能:主要功能简单地说就是执行全部指令。EU完成以下几个主要任务:指令译码、执行指令、向BIU传送地址信息以及管理通用寄存器和标志寄存器。
(3)配合工作:只要指令队列不满,则BIU就去取指令,只要指令队列有指令,EU就执行指令,二者同时进行。EU向BIU指供地址信息,BIU计算物理地址,并指向目标地址并取数据或指令或送数据到目标地址,而EU负责运算和处理。BIU和EU既相互独立又相互配置并行流水作业。
2-7 80286由哪几个主要部件组成?各自的功能是什么?与8086有什么不同?
答:1.组成:80286微处理器内部共有四个功能部件:地址部件 AU、总线部件BU、指令部件IU和执行部件EU。
2.功能:(1)总线部件BU负责内外信息交换;(2)指令部件IU负责从预取队列中取代码并进行译码,然后放入3条指令的指令队列中;(3)地址部件AU负责物理地址的生成;(4)执行的EU负责指令的执行。
3.与8086的不同点:
(1)地址线条数不同,因此寻址空间不一样(8086:20条寻址1MB,8028624条寻址16MB) (2)内部结构不同,比8086多了两个部件,同时多了一个指令队列(已译码的指令队列) (3)速度提高(8086:5MHz,80286:16MHz)
(4)多了一种工作方式,支持多任务中,虚拟内存,寻址方式不同 2-8 80386与80286相比内部由几个主要部件组成?各部件的功能是什么?
答:1.组成:6个部件:总线部件BU、指令预取部件IPU、指令译码部件IDU、执行部件EU、分段部件SU和分页部件PU。
2.功能:
(1) 总线部件BU:提供与外部(存储器以及I/O)的接口环境(地址线、数据线和控制线的驱动等)。在80386内部,指令预取部件要从存储器中取指令、执行部件在执行指令时要访问存储器或I/O,分页部件形成物理地址后,都要发出总线周期的请求,BU会根据优先级对这些请求进行仲裁,从而有
4 《微型计算机及接口技术》
序地服务于多个请求,并产生相应的总线操作所需要的信号,包括地址信号、读/写控制信号等。BU还提供了与协处理器如80387或 80287的接口。
(2)指令预取部件IPU通过BU按顺序向存储器取指令并放到16个字节的预取指令队中,为指令译码部件提供有效的指令。
(3)指令译码部件IDU从预取指令队列中取出原代码后进行译码,并将译码好的指令存放在3条指令的队列中,送给执行部件。
(4)执行部件EU包括ALU以及64位的桶形移位寄存器和8个32位的通用寄存器及保护检测电路等,EU从IDU中取出已译码的指令后,立即通过控制电路产生各种控制信号送到内部各个部件,从而执行了该指令。在执行指令的过程中,向分段部件发出逻辑地址信息,并通过BU与外部交换数据。
(5)分段部件SU将EU送来的两路32位有效地址(包括逻辑地址48位:16位选择子和32位段内偏移地址)通过描述符的数据结构形成32位的线性地址。
(6)分页部件PU接收到线性地址后,通过两次页转换将其变换为实际的32位物理地址。 2-9 简述P5架构的Pentium处理器的结构特点。 答:(1) 与80X86系列微处理器兼容
(2) RISC型超标量结构:两条指令流水线(U+V) (3) 高性能的浮点运算器
(4) 双重分离式高速缓存:将指令高速缓存与数据高速缓存分离,各自拥有独立的8KB高速缓存,使其能全速执行,减少等待及传送数据时间。
(5) 增强了错误检测与报告功能:内部增强了错误检测与报告功能,特别引进了在片功能冗余检测(FRC),并采用了一种能降低出错的六晶体管存储单元。
(6) 64位数据总线:使用64位的数据总线(80386/80486为32位)。
(7) 分支指令预测:处理器内部采用了分支预测的技术,大大提高了流水线执行效率。 (8) 常用指令固化及微代码改进
(9) 系统管理方式:在实地址方式、保护方式、虚拟86方式的基础上,增加了SMM(系统管理方式)。
2-10 Pentium处理器的U和V两条指令流水线的功能是什么?主频为100MHz的Pentium处理器,最快执行两条指令的时间为多少ns?
答:(1)U流水线主要用于执行复杂指令,而V流水线只能执行简单指令。
(2)最快执行两条指令的时间是一个时钟周期,100MHz主频其一个时钟周期为1/100 (us)=10ns。2-11简述Pentium处理器的BTB的功能。
答:BTB(分支目标缓冲器)可对分支指令进行预测,目的是提高流水线执行效率。在Pentium微处理器中,使用了BTB预测分支指令,这样可在分支指令进入指令流水线之前预先安排指令的顺序,而不致使指令流水线的执行产生停滞或混乱。
2-12 简述P6架构的处理器的主要特点,基于该架构的PentiumII和PentiumIII特点如何? 答:1.架构的主要特点如下:
(1)三条超标量指令流水线,每条12级超流水线(细分也可认为14级),使一个时钟周期内可同时执行三条简单指令。
(2) 5个并行处理单元:两个整数运算部件,一个装入,一个存储,1个浮点运算部件(FPU)。(3)8KB两路相关指令高速缓存,8KB四路相关数据高速缓存。
国家十一五规划教材《微机原理与接口技术(第二版)》思考题与习题参考答案 5
(4)专用全速总线上的二级高速缓存与微处理器紧密相联。 (5)事务处理I/O总线和非封锁高速缓存分级结构。 (6)错序执行,动态分支预测和推理执行。 2. Pentium II处理器的显著特点有: (1)双重独立总线(DIB)体系结构
能同时使用具有纠错功能的64位系统总线和具有可选纠错功能的64位Cache总线。 (2)多重跳转分支预测
通过多条分支预测程序执行,加快了工作向处理器的流动。 (3)数据流分析
分析并重排指令,使指令以优化的顺序执行,与原始程序的顺序无关。 (4)指令推测执行
通过预先查看程序计数器PC并执行那些将要执行的指令,提高了速率。 (5)采用Intel MMX技术
包括了57条增强的MMX指令技术,可处理视频、声频及图像数据。 Penitum Ⅲ与Pentium Ⅱ相比,主要参数特点如下: (1)主频450MH以上到1.1GHz (2)总线频率100MHz/133MHz (3)新增加70条SSE指令
(4)2.0V供电,0.25到0.18微米工艺制造
(5)32KB的L1以主频速度工作,512KB的L2以主频一半速度工作
2-15 Pentium 4处理器,一个时钟周期内可执行多少条简单?如果3.0GHz的Pentium 4执行9条简单指令,最快需要多长时间执行完?
答:P4内部有一个复杂指令流水线和两个快速流水线,快速流水线倍速工作,因此每个时钟可执行5条简单指令。3GHz对应的周期为1/3ns,9*1/3=3ns即9条指令最短可在3ns内执行完毕。
2-17 一个典型的Cure 2 Duo处理器一个时钟可以执行多少条简单指令?2.0GHz的Cure 2 Duo处理器在1ns内最快能执行多少条简单指令?
答:由于Cure 2 Duo是典型的双核处理器,每个内核有4个译码器和相关执行单元,即有4条指令流水线,因此,单一时钟可执行简单指令4×2=8条;时钟频率2GHz即时钟周期为0.5ns,即要0.5ns 内可执行简单指令8条,1ns/0.5ns×8=16条,即2GHz的Cure 2 Duo可在1ns内指行16条简单指令。
2-18 总结一下8086/8088到Cure 2 Duo处理器外部地址线、数据线条数、通用寄存器的位数以及所处的工作方式。各自的位长以及所能寻址的物理地址空间有多大?
答:从8086到Cure 2 Duo的相关参数如下表所示表。
处理器 主要参数 通用寄存器位数即位长 外部数据线条数 外部地址线条数 16 16 20 16 8 20 16 16 24 实方式 工作方式 实方式 实方式 保护方式 保护V86 保护、V86 32 32 32 实方式 32 32 32 实方式 V86、系统管V86、系统管V86系统管V86系统管V86、系统管V86、系统管系统管理、V86、系统管理 理 理 理 理 理、超线程 IA-32E 理、IA-32E 32 64 32 32 64 36 32 64 32 32 64 36 32 64 36 32 64 36 32/64 64 36 32/64 64 36 32/64 64 36 实、保护、V86、系统管理、IA-32E 8086 8088 80286 80386 80486 Pentium Pentium Pro Pentium MMX Pentium II Pentium III Pentium 4 Core 2 Duo Core 2 Quad (双核) (四核) Core 2 Extreme (至尊) V86、实,保护、实、保护、实、保护、实、保护、实、保护、实、保护、实、保护、实、保护、