条件分支 跳转和调用 20%(其中60%是成功的) 5% 现有一深度为4地流水线(流水线有4段),无条件分支在第二个时钟周期结束时就被解析出来,而条件分支要到第三个时钟周期结束时才能被解析出来。第一个流水段是完全独立于指令类型的,即所有的指令都必须经过第一个流水段的处理。请问在没有任何结构相关地情况下,该流水线相对于存在上述结构相关情况下地加速比是多少? 9、答案内容:
解:在不存在结构相关时,每条指令的平均执行时间是1个时钟周期,而存在上述条件相关的情况下,并假设条件分支预测成功,那么无条件分支和成功的条件分支的等待时间都是1,而不成功地条件分支等待时间是2个周期;所以加速比就等于存在相关的每条指令的平均执行时间和不存在相关的每条指令的执行时间1的比值:
加速比?1?C?1?f?P分支
P无条件分支=1stallP条件分支=2stall 4分
每条指令的平均等待时间:
C?f条件分支?P条件分支+f无条件分支?P无条件分支=20%?60%?2+20%?40%?1?5%?1 4分 =0.37所以:加速比?1.37 2分
10、评分细则:10分/小题,评分细则分布在答案内容中。
----------------------------------------------------------------------
1、试题序号:598 2、题型:计算题 3、难度级别:4
4、知识点:3.5 向量处理机 5、分值:10
6、所需时间:15分钟
7、试题关键字:向量处理机 8、试题内容:
CRAY-1机器上,按照链接方式执行下述4条向量指令(括号中给出了相应功能部件的时间),如果向量寄存器和功能部件之间数据传输需要1拍,试求此链接流水线的通过时间是多少拍?如果向量长度为64,则需要多少拍才能得到全部结果。
V0←存储器 (从存储器中取数:7拍) V2←V0+V1 (向量加:3拍) V2←V2 < A3 (按(A3)左移:4拍)
V5←V3∧V4 (向量逻辑乘:2拍) 9、答案内容:
解:通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就
是各功能流水线由空到满的时间,具体过程如下图所示。要得到全部结果,在流水线充满之后,向量中后继操作数继续以流水方式执行,直到整组向量执行完毕。 2分
访存存储器V0V1V2V3V4V5向量加左移向量逻辑乘A3 T通过=(7+1)+(1+3+1)+(1+4+1)+(1+2+1)=23(拍) 6分
T总共?T通过+(64-1)=23+63=86(拍) 2分
10、评分细则:10分/小题,评分细则分布在答案内容中。
----------------------------------------------------------------------
1、试题序号:599 2、题型:计算题 3、难度级别:4
4、知识点:3.5 向量处理机 5、分值:10
6、所需时间:15分钟
7、试题关键字:向量处理机 8、试题内容:
向量处理机有16个向量寄存器,其中V0~V5中分别存放有向量A、B、C、D、E、F,向量长度均为12,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停留的情况下,接着计算(D+E)*F。
(1) 求此链接流水线的通过时间为多少拍?(设寄存器入、出各需1拍) 假如每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件地实际吞吐率为多少MFLOPS? 9、答案内容: 解:(1)我们在这里假设A+B的中间结果放在V6中,(A+B)*C地最后结果放在V7中,D+E地中间结果放在V8中,(D+E)*