计算机系统结构向量处理机精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机系统结构向量处理机精选PPT.ppt》由会员分享,可在线阅读,更多相关《计算机系统结构向量处理机精选PPT.ppt(45页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、计算机系统结构向量处理机第1页,此课件共45页哦计算机系统结构第一章 基本概念第二章 指令系统第三章 存储系统第四章 输入输出系统第五章 标量处理机第六章 向量处理机第七章 互连网络第八章 并行处理机和 多处理机第2页,此课件共45页哦第六章 向量处理机6.1 向量数据表示方式6.2 向量处理机的结构6.3 向量处理方式6.4 向量处理机的关键技术6.5 向量处理机实例6.6 向量处理机的性能评价6.7 向量处理机的发展第3页,此课件共45页哦6.1 向量数据表示方式向量处理机是解决数值计算问题的一种高性能计算机结构向量处理机一般都采用流水线结构,有多条流水线并行工作向量处理机通常属大型或巨型
2、机,也可以用微机加一台向量协处理器组成一般向量计算机中包括有一台高性能标量处理机必须把要解决的问题转化为向量运算,向量处理机才能充分发挥作用第4页,此课件共45页哦6.1 向量数据6.1.1 从标量到向量第5页,此课件共45页哦6.1.1 从标量到向量例如:一个简单的C语言程序如下:for(i=10;i=1010;i+)ci=ai+bi+5;在向量处理机上,可以只用一条指令:C(10:1010)=A(10:1010)+B(15:1015)一条向量指令可处理个或对操作数在标量处理机上用10多条指令,其中有8条指令要循环1000次。采用多寄存器结构的两地址指令编写程序。第6页,此课件共45页哦存储
3、器采用字节编址方式,字长为32位在一般标量处理机中需要如下指令序列来实现(A、B、C分别是向量a、b、c在内存中的起始地址):START:LOADR0,ST;读循环初值,10LOADR1,ED;读循环终值,1010LOADR2,L;读内存地址增量,;常数4MOVER3,R2MULR3,R0;向量偏移量,;初始值为40LOOP:LOADR4,A(R3);读A向量的;一个元素第7页,此课件共45页哦LOADR5,B(R3);读B向量的一个元素ADDR4,R5STORER4,C(R3);写C向量的一个元素ADDR3,R2;改变向量偏移量INCR0;循环次数增1CMPR0,R1;循环是否结束BLELO
4、OP;循环未结束转LOOP,;否则继续HALTST:10;循环初值ED:1010;循环终值L:4;内存地址增量第8页,此课件共45页哦第六章 向量处理机6.1 向量数据表示方式6.2 向量处理机的结构6.3 向量处理方式6.4 向量处理机的关键技术6.5 向量处理机实例6.6 向量处理机的性能评价6.7 向量处理机的发展第9页,此课件共45页哦6.2 向量处理机结构向量处理机的最关键问题是存储器系统能够满足运算部件带宽的要求。主要采用两种方法:1.存储器存储器结构多个独立的存储器模块并行工作处理机结构简单,对存储系统的访问速度要求很高2.寄存器寄存器结构运算通过向量寄存器进行需要大量高速寄存器
5、,对存储系统访问速度的要求降低第10页,此课件共45页哦6.2.1 存储器存储器结构向量处理机中有多个高速流水线运算部件,存储器的访问速度是关键采用多个存储体交叉和并行访问来提高存储器速度,例如:CRAY-1有64个存储体,每个处理机访问4个存储体STAR-100采用32个存储体交叉,每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体第11页,此课件共45页哦操作数缓冲栈和写结果缓冲栈主要用于解决访问存储器冲突虽然采用质数个存储体能消除访问存储器的冲突,但是,数据经过多次运算之后,在存储体中分布必然发生改变主要优缺点:硬件结构简单,造价低;速度相对较低操作数缓冲栈写结果
6、缓冲栈主存储器流水线运算部件第12页,此课件共45页哦6.2.2 寄存器-寄存器结构把存储器-存储器结构中的缓冲栈改为向量寄存器,运算部件需要的操作数从向量寄存器中读取,运算的中间结果也写到向量寄存器中。向量寄存器与标量寄存器的主要差别是:一个向量寄存器能够保存一个向量,例如:64个64位寄存器。连续访问一个向量的各个分量。需要有标量寄存器和地址寄存器等。第13页,此课件共45页哦采用寄存器-寄存器结构的主要优点:降低主存储器的流量。例如:采用寄存器-寄存器结构的CRAY-1与采用存储器-存储器结构的STAR-100比较,运算速度高3倍多,而主存流量低2.5倍。STAR-100的主存储器流量:
7、328W/1.28us=200MW/SCRAY-1的主存储器流量:4W/50ns=80MW/S第14页,此课件共45页哦计算机系统结构(第21讲)第15页,此课件共45页哦第六章 向量处理机6.1 向量数据表示方式6.2 向量处理机的结构6.3 向量处理方式6.4 向量处理机的关键技术6.5 向量处理机实例6.6 向量处理机的性能评价6.7 向量处理机的发展第16页,此课件共45页哦6.2 向量处理机结构向量处理机的最关键问题是存储器系统能够满足运算部件带宽的要求。主要采用两种方法:1.存储器存储器结构多个独立的存储器模块并行工作处理机结构简单,对存储系统的访问速度要求很高2.寄存器寄存器结构
8、运算通过向量寄存器进行需要大量高速寄存器,对存储系统访问速度的要求降低第17页,此课件共45页哦6.2.1 存储器存储器结构向量处理机中有多个高速流水线运算部件,存储器的访问速度是关键采用多个存储体交叉和并行访问来提高存储器速度,例如:CRAY-1有64个存储体,每个处理机访问4个存储体STAR-100采用32个存储体交叉,每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体第18页,此课件共45页哦采用寄存器-寄存器结构的主要优点:降低主存储器的流量。例如:采用寄存器-寄存器结构的CRAY-1与采用存储器-存储器结构的STAR-100比较,运算速度高3倍多,而主存流量低
9、2.5倍。STAR-100的主存储器流量:328W/1.28us=200MW/SCRAY-1的主存储器流量:4W/50ns=80MW/S第19页,此课件共45页哦8个向量寄存器86464主存储器8MB64个个体12个流水线结构的运算部件缓冲寄存器6464标量寄存器864缓冲寄存器6424地址寄存器824指令缓冲寄存器25616CRAY-1向量处理机结构第20页,此课件共45页哦第六章 向量处理机6.1 向量数据表示方式6.2 向量处理机的结构6.3 向量处理方式6.4 向量处理机的关键技术6.5 向量处理机实例6.6 向量处理机的性能评价6.7 向量处理机的发展第21页,此课件共45页哦6.3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 向量 处理机 精选 PPT
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内