在线客服
首页 > 技术文章 >
技术文章
技术文章

满足游戏玩家对速度的渴望 PCI Express加速影像数据传输

全世界的游戏玩家除了需要传神、更棒的绘图作用与画质外,其它全部就是速度、速度、速度,因而游戏描绘业者总是努力地满意玩家的需要。但是,如今的计算机体系能否可以满意他们的需要?现有技能能否满意因应?这些问题的答案很多,但PCI Express印象总线技能无疑是一个令人兴奋的答案。  
 在典型的计算机游戏体系中运用一个十分规范化的芯片架构。首要的计算机运算作业由中央处置器担任,其它不是由处置器(一般由Intel或AMD制作)直接处置的作业,则是由北桥芯片或「内存操控器集线器(MCH)」操控CPU、内存以及衔接绘图卡之16通道PCI Express原始衔接端口(Root Port)之直接口的传输作业。南桥芯片或I/O操控器集线器(ICH)则透过一种特定电子接口与北桥芯片衔接,为体系供给多种不相同的外围衔接点(图1)。  
 在体系中绘图与游戏之间的联系,均与绘图卡效能(图1中标有GFX的有些)以及从体系将印象信号传输到屏幕上的效能有关,这正是PCI Express成为抱负数据传输衔接的缘由。曩昔,这种总线的数据传输作业(图2)需要好几种不相同的技能,而每种新总线技能的诞生都着重能带来全新的绘图效能,并能消弭各种体系瓶颈。  
 数据传输为体系瓶颈  
 不论是哪种体系,工程师都须考虑体系瓶颈的要素,对体系工程师而言,所谓瓶颈是指数据传输在体系的某个有些遭到约束。幻想在一个装备三名工的拼装出产线中,1号职工每分钟能拼装5个组件,2号职工每分钟能拼装10个组件,而3号职工每分钟只能拼装2个组件,在这种情况下,3号职工就是出产线中的瓶颈,由于整条出产线的产出遭到速度最慢的职工所约束,这等于每分钟只能出产2个产物,若是指使别的一名人员去帮忙3号职工,整个体系的效能就能进步。在通讯或数据处置的环境中,所谓的瓶颈指的是在整个体系各个部份间,出现狭隘的频宽通道,若在最新的计算机游戏中,以上所说的数据传输约束发作在印象画面所需的数据传输上,那么这种传输瓶颈就是计算机游戏玩家的公敌。  
 在知道对频宽的需要以及怎么消弭瓶颈之前,首要有必要知道在底子技能上的约束。如在「雷神之锤3」(Quake 3)这类3D游戏的场景中,有些目标运用相同的X与Y坐标值,若要到达更高的传神度,关键在于这些坐标值在Z轴的相对方位。在以往的计算机游戏中,每个像素都仅限于X-Y轴的平面上,底子没有景深可言,但是,当前新开发的游戏中则加入了3D或Z轴的概念,这是为了发明更传神游戏场景。  
 

目标在Z轴上定位的概念称为「Z轴缓冲区算法」(Z-buffing),这种算法决议哪些目标或目标的哪些部份会显现在屏幕上,或是哪些目标会被隐瞒(图3)。Z轴缓冲区(Z-buffer)是绘图内存中的一个独特区域,里边储存着每个像素的Z轴或景深材料。当描绘目标时,每个像素的Z轴值会与在Z-buffer中同一方位的像素点进行比对,若像素的Z轴值较高(如图中球体所示),或较挨近游戏玩家,则体系会在讯框缓冲区(Frame Buffer)写入新的像素值,且Z-buffer会更新Z轴值的数据内容。



为什么Z-buffer很重要?由于计算机游戏的传神度取决于Z-buffer表格中数值数据的准确度。若Z-buffer设定的深度值愈高,出现视觉瑕疵的时机就愈低或多层重迭的表象就会不见。首要的关键在于若数据更新的速度够快,并能妥善地进行缓冲作业,就可在节奏疾速与高细腻度的游戏画面中,精准地出现一切Z轴数值。因而业界决议选用PCI Express总线技能。



PCI Express总线为数据传输架构



当前3D绘图卡具有的处置效能可比美体系中首要的中央处置器。绘图处置器(Graphics
processing unit, GPU)能处置许多可发作传神印象的特定功用,以满意游戏玩家的需要。此外,屏幕上的3D场景,皆是由3D多边形(一般为三角形)所建构成,这些多边形会置于Z-buffer中,因而只要印象前方会显现在屏幕上,而无法透视目标的反面。然后,运用光源作用,让3D目标可显现出亮部以及投射暗影的区域。最终再为每个多边形进行原料贴图(图4)。



在3D绘图卡所显现的每个印象皆是以多边形构成,实际上,多边形是许多三角形或由两个三角形构成「四角形」。3D目标的外表是由许多三角形所组成,并依据在场景中的POV(Point
of View)观测点相对方位进行贴图。当CPU在传送某个目标出现在屏幕上或挪动点的消息时,目标的极点坐标就会透过接口总线,从主机内存传送到印象卡的内存。虽然接口总线能否传送最重要消息仍备受争议,但这并非总是占有大都频宽的材料。图4所示的球体就是由数百个点所组成,而地球的贴图则是上万个像素与颜色深度的字节所构成。



极点会耗用多少PCI Express或AGP的传输频宽?在印象范畴没有必定的数值,由于屏幕上显现的数据都不相同,而且数据显现所运用的顺序运作的方法也不尽相同。NVIDIA比来宣布一个由10万个多边形所构成的狼人动画展示(图5),每个多边形内含有3个64位的极点,在每秒60个画面的更新率的情况下,印象传输的速度约为每秒50
0MB,关于硬盘接口而言,这是适当高的数据传输量,但关于AGP或PCI Express,却是垂手可得的事。



图6显现体系的数据流以及缓冲区操控的景象,当狼人的多边形数据传到绘图卡的印象内存时,就会被放置于Z-buffer,Z-buffer会剖析A物体能否会显现在屏幕上,或是是会被B物体掩盖,若是描绘人员将原本在屏幕上部份或许彻底躲藏的物体显现出来例如在街头打架或战役场景,Z-buffer也会耗费很多的印象频宽。此外,虽然一个目标没有在屏幕上显现出来,它仍是会存在Z-buffer之中,举例来说,印象引擎中有一迭扑克牌,每张牌都会被置入Z-buffer中,然后再逐一被下一张牌所掩盖。



当数据被置入Z-buffer中,就会加上各种光源作用,这些作用的处置作业适当杂乱,包罗分散式光源、直接光源、直接光源,以及反射光源,均有不相同的处置方式。这些光源作用的运用只会耗费印象卡中内存的频宽,因而不会影响到PCI Express或AGP的传输频宽。



一般来说,印象的原料数据占有了CPU RAM与GPU RAM之间最多的传输频宽,曩昔是由原料数据促进32位PCI(PCI Classic)转移到AGP总线技能,由于原料数据与图画(或微型图片)会被贴在多边形的外表,因而会在印象卡上占用不少的内存空间,而且需要花费不少加载时刻。



除此之外,若一个场景所需要的原料已储存在RAM内存之中,就只需要少数的内存或许PCI Express总线频宽,但是,当原料缓冲区发作超载情况,以及GPU有必要透过AGP或PCI Express总线来存取原料内存的时后,PCI Express的功用就得以充份展示。



图7显现各种内存频宽高达每秒10GB的中阶绘图卡之内存频宽运用情况。若每个像素被存取10次(由于需要许多不相同的原料数据以及上色细腻度所造成的),内存频宽还能牵强敷衍16信道PCI Express的传输速度。



但是,若游戏玩家运用的体系或游戏,每个像素需要存取15次以上,PCI Express(或任何总线)则没有满意的频宽来传输极点或原料数据,一起画面更新率会开端下滑。



若原料缓冲区超载,且需要从RAM内存传出数据,AGP总线会以每秒2MB的速度传送原料数据,这让画面更新率会大幅下滑,或以PCI
Express 16信道总线传送数据,让每秒10GB的传输接口略微减缓传输速度,若GPU自身有富余的内存可以运用,加上描绘人员独特慎重的话,运用软件可以一起运用PCI Express的频宽以及印象内存的传输频宽!



以数据传输率与存取速度致胜



在任何PC游戏中,具有最强兵器的玩家总是成功的一方。具有最强数据传输管线技能的工程师也是永久的赢家。



PCI Express富余的传输管线能供给PC游戏描绘人员满意的数据传输率与存取速度,以满意如今PC游戏玩家关于技能优势的需要。关于以往PC绘图规范而言,PCI Express的演进与立异,源自于计算机游戏界关于技能继续晋级的需要,如今从事立异描绘的工程师所面对的应战是怎么在当前的运用体系中,充份发扬PCI Express的效,并考虑能还有什么立异技能可以运用?怎么续持打破先进技能?怎么在游戏中充份发扬新一代总线技能PCI Express的频宽与功用优势?
北京迪阳世纪科技有限责任公司 版权所有 © 2008 - 2018 著作权声明
010-62156134 62169728 13301007825 节假日:13901042484 微信号:sun62169728
地址:北京市西城阜外百万庄扣钟北里7号公寓
E_mail:sales@pc17.com.cn 传真: 010-68328400
京ICP备17023194号-1 公备110108007750