NVIDIA Chinajoy媒体讲解会会议记录
所以,我们的产品在最新的DX11游戏中是可用性,而竞争对手产品在最新的DX11游戏中是不可接受的运行帧率,所以大家要记住50%的差异带来的不是好一点或者不错,而是可与不可之间非常大的天渊之别。
我们讲到DX11,其实在DX11的部分最重要的功能叫“曲面细分”。曲面细分这个功能是之前在DX10或者更早的GPU的API,以及GPU的内部架构中所不能支持的。那么DX11的曲面细分所带来的最重要的部分就是可以把以前的一个建模中间的某一个曲面再不被细分成成千上万,甚至更多的这样的一个小的多边形。而在这样一个密集的运算量的情况下,我们可以保证游戏的画面得到前所未有的细节性的提高。比如说我们在Tessellation中间,我们可以看到整个人物建模的画面,一些细节的部分,包括说地上的石头,包括建筑屋顶上的瓦都会变得前所未有的真实起来。
正因为我们要把先前的某一个曲面再次细分成成百上千甚至上万个曲面,来进行细分这个动作,所以我们在GPU里面效果加入固定的处理单元,我们称作“多形体引擎”,英文叫Polymorphs Engine,这个引擎是物理存在于GPU的中间的一部分电路。而这个引擎所做的功能,就是把旧有的一些曲面再次切割成更多个更多个细分出来的曲面。所以在这样的情况下,这个多形体引擎的执行效率,以及它的执行速度将会影响整个DX11游戏的执行效率和速度。那么NVIDIA的产品,我们整个400系列的项目,基于Fermi架构的GPU,我们在设计初期的时候,在每一组渲染的模组里面,都加入一个独立的多形体引擎,所以从架构上来讲最多可以容纳16个多形体引擎,同时并行的去处理曲面细分的动作。而我们的竞争对手,他们设计理念跟我们完全不同,他们是在整个GPU的流水线的最前端加入唯一的一个多形体引擎。
所以我们从架构上来讲,旗舰级的架构上来讲可能是1:16这样的一个性能和架构上的优势,我们在处理这个曲面细分动作的时候,和整个流水线支撑效率的时候,我们在这一块效果更有优势。所以这就带来了,如果当DX11的游戏会被越来越多的应用,而曲面细分的功能也被越来越多应用的时候,我们竞争对手的产品存在一个瓶颈,就在于这个Tessellation,这个曲面做细分动作的时候,后面所有渲染的处理器都在等待前端把这个切割的动作完成,而我们由于是一个大量的,并行的,同时最多可以达到16个多形体引擎的架构,所以在整个DX11的架构上的先天性的优势是非常明显的。
所以NVIDIA的GPU,叫做真正的原声的支持DX11的真DX11 GPU,我们可以完美支持DX11的灵魂,就是曲面细分这样的功能。这也从另外一个角度来阐述了为什么我们的GPU,大家可以看到我们在市场上面世的时间可能略比竞争对手稍晚一点点,因为我们在整个测试中间,正因为发现了如果采用加入一个方式,打补丁的方式来实现对DX11的支持,会面临着极大的性能瓶颈和今后的挑战。所以我们在架构上做了一个重大的修改,所以我们的产品在这部分,虽然略晚一些,但是我们真正的为DX11设计,为DX11优化,和为今后所有用户的DX11需求进行考量,来设计整个架构的产品。
所以大家看到基于这样的一个设计思路,在真正的DX11的Tessellation中间,我们比竞争对手快得多,而且这个50%和70%是相当保守的数据。大家可以看到在这个设置的部分,我们的分辨率仅设置为16X10,或者16X12,如果我们把分辨率设得更高,比如设成2560X160,我们把Tessellation曲面细分设置成极限这样的方式,我们的速度在游戏里边可以比竞争对手快两倍甚至更多。如果我们使用微软的官方的DX11的SDK,把Tessellation曲面细分的级数开到最大的话,我们在个别苛刻的场景可以比竞争对手快20倍。所以在这部分,可以显示出我们的设计思路,给整个游戏的玩家所带来的一个巨大的前瞻性的性能的优势。这是NVIDIA对于游戏玩家的投资保护,和投资更加负责任的企业的做法,我们让我们的用户,不仅仅是花钱获得知识,而是花钱获得一个更好的,在今后可预见的相当长的一段未来里,都可以获得非常完美的游戏享受的这样的一个设计理念。
我们讲到460这个产品,我们说它跟480比,虽然说比它略低一个层级,但是我们仍然可以支持整个480整个所拥有的全部功能。包括我们的NVIDIA独有的物理加速,