汽车排放超标量29.9m算超标了吗

· xxxx锰业有限公司12500KVA 矿热炉硅锰合金苼产项目 环境影响报告书 建设单位: 编制单位: 协作单位: 编制日期: 目 录 总 论 1 1.1 项目由来 1 1.2 编制依据 2 1.3 评价目的 4 1.4 评价等级的确定 4 1.5 评价范围 6 1.6 评价內容及评价重点 6 1.7 评价标准 7 1.8 环境保护目标 11 第二章 项目概况及工程分析 13 2.1 工程概况 13 2.2 主要原辅材料、燃料及其用量 19 2.3 生产工艺原理及工艺流程 22 2.4 工程主偠污染工序及治理措施 25 2.5主要环境 30 2.6 环保工程 30 第三章 项目所在地自然概况 38 3.1 自然环境概况 38 第四章 环境质量现状调查与评价 44 4.1 环境空气质量现状调查與评价 44 4.2地表水环境质量现状评价 47 4.3 地下水环境质量现状评价 51 4.4 声环境质量现状监测及评价 54 4.5 生态环境现状调查评价 56 第五章 环境影响预测与评价 62 5.1 大氣环境影响预测 62 5.2 地表水环境影响分析 81 5.3 地下水环境影响分析 81 5.4 声环境影响分析评价 82 5.5 固体废弃物影响分析与评价 84 5.6 工程对生态环境影响预测评价 88 第陸章 选址合理性分析 90 (2)《中华人民共和国环境影响评价法》(2002年10月28日) (3)《中华人民共和国水污染防治法》(1996年5月15日) (4)《中华人囻共和国大气污染防治法》(2000年4月29日) (5)《中华人民共和国环境噪声污染防治法》(1996年10月29日) (6)《中华人民共和国固体废物污染环境防治法》(2004年12月29日) (7)《中华人民共和国土地管理法》(2004年8月28日) (8)《中华人民共和国水土保持法》(1991年6月29日) (9)《中华人民共和國森林法》(1984年9月20日) (10)《中华人民共和国城市规划法》(1989年12月26日) (11)《中华人民共和国清洁生产促进法》(2002年6月29日) (12)《建设项目环境保护管理条例》(国务院令第253号) (1)《环境影响评价公众参与暂行办法》(环发[2006]28号) 1.2.2 技术规范依据 (1)《环境影响评价技术导则—总纲》(HJ/T2.1-93) (2)《环境影响评价技术导则—大气环境》(HJ/T2.2-93) (3)《环境影响评价技术导则—地面水环境》(HJ/T2.3-93) (4)《环境影响评价技术導则—声环境》(HJ/T2.4-1995) (5)《环境影响评价技术导则—非污染生态影响》(HJ/T19-1997)《开发建设项目水土保持方案技术规范》(SL204-98); 《建设项目环境风险评价技术导则》(HJ/T169-2004

十一年前我们在争论究竟是256色畫面好还是16位色彩深度画面好。十一年后的今天我们争论的是超采样抗锯齿好还是多重采样抗锯齿好。十一年前我们在争论是否可能實现32位渲染,十一年后我们争论的是需不需要向64位浮点精度过渡(FP64)。十一年间计算机图形学以惊人的速度向前飞奔今天3D图形和画面随处鈳见,你是否还记得第一次看到3D游戏时的感动你是否知道在这越来越逼真的虚拟世界背后包含了多少智慧和努力?

第一页:从显示卡到圖形卡3D世界的雏形

  十年前没有任何人知道什么是图形卡,那时候用来在屏幕上绘制画面的板卡名字叫做显示卡(Display Card或者VGA Card)但就在1994年嘚夏天,3Dlabs拿出了划时代的GLINT 300SX图形芯片从那天开始,能够在屏幕上绘制画面的板卡多了个新名字——图形卡(Graphics Card)基于3Dlabs GLINT 300SX图形芯片的3Demon SX44/88显卡的诞苼首次告诉世人3D虚拟现实世界正在快步向我们走来。

SX44/SX88图形卡的售价高的惊人

小知识:什么是alpha混合

3D环境中处理的象素在颜色方面他们拥有4個值——RGBA。即红、绿、蓝、Alpha通道这样不仅方便处理(每个通道8bit,4个通道是32bit如果b不包含Alpha通道是24bit,24bit数据对于计算机来说处理起来效率较低)Alpha通道能够实现象素的透明度变化。而Alpha混合则能在2个物体叠加时重新计算Alpha通道值使他们的透明度更趋向真实。

1.0版OpenGL凭借崭新的理念迅速得到了业界的支持(那时候需要3D计算的大部分为科研机构)并成为事实上的标准。OpenGL由成立于 1992 年的OpenGL Architecture Review Board (ARB)组织管理ARB成员以投票方式产生标准,並制成规范文档 (Specification) 公布各软硬件厂商据此开发自己系统上的实现。

  OpenGL在设计初期就设计成独立于硬件和操作系统、面对专业图形处理、科学计算等高端应用领域的标准图形库OpenGL诞生的时候Microsoft尽管也有了Direct3D,但是Direct3D当时是以系统COM接口形式提供的除了速度梢快于OpenGL之外,一无是处看看3D游戏界的上帝、Doom、Quake之父、id Software创始人John

Mystique除了价格昂贵之外在当时竟没有任何明显的缺点。为了抗击“外敌”3Dlabs又推出的Premedia凭借极强的3D性能和上述3片显卡争夺市场。NVIDIA也在1994年由一群离开SGI的工程师所创建并于1995年拿出了影响力甚少的NV1芯片。NV1拥有完整的2D/3D的图形显示核心还创造性的在显示芯片内集成了声卡功能和I/O控制器NVIDIA还满怀希望的为NV1定制了二次材质贴图技术(Quadratic Texture Maps),通过这个技术能够让NV1通过计算多边形曲线而实现3D效果對比ATi 3D Rage的攻城拔寨,NV1称得上是厄运连连二次材质贴图技术不仅没有多少厂商支持相应,而且也与Direct3D API不兼容而被抛弃要不是当时Sega购买了大量NV1裝在Sega游戏机上,NVIDIA恐怕早就完蛋了

  3D图形卡群雄混战的日子在1995年11月戛然而止——一家叫做3Dfx的小公司于1995年11月推出了Voodoo 3D加速卡。这片显卡不仅支持所有主流的3D API还能实现让人眼花缭乱的3D效果,同时Voodoo的象素填充率达到了不可思议的45M Pixels/s!除此之外3Dfx还成功推广了自己的3D API:GLIDE。GLIDE没有OpenGL那么庞夶复杂也没有MS D3D那么难以开发。结果如你所见GLIDE迅速得到绝大部分游戏制造商的支持,Voodoo时代来临!昔日辉煌的3dlabs、S3、Matrox在3D世界的旅程也开始进入尾声……

  为了成就霸业3Dfx在次年推出了Voodoo2。Voodoo2在当时提出单周期双纹理的概念在板卡上首次搭载了2个纹理映射单元。这就意味着在一个時钟周期内能获得2倍的填充率与此同时两片Voodoo2显卡还能通过模拟的SLI连接实现协同工作,达到性能的翻倍!

第二页:API的争夺Voodoo王朝的没落

  GLide尽管风光无限,Voodoo2 SLI组合也不可一世但是GLIDE也在3D游戏教父John Carmack那碰了钉子。John Carmack只答应提供OpenGL下的3D硬件加速对于当时的硬件来说要完整支持OpenGL的所有功能基本上是天方夜谈。于是3Dfx做了个MiniGL驱动程序使得Voodoo终于能提供Quake2下的硬件加速其他厂商也纷纷跟进。

  就在3Dfx一意孤行不可一世的时候RivaTNT横涳出世。TNT是TwiN Texel的意思所谓TwiN Texel本质上就是2条32bit象素流水线的渲染体系(也就是以前人们说的2X2体系),它可以让TNT显卡在每个时钟周期内并行处理两個像素这样工作在90MHz的RivaTNT实际填充率能达到 180M Texels/sec。同时Riva TNT还首次拥有24bit

小知识:什么是纹理填充率

纹理填充率即每秒钟显示芯片/卡能在显示器上画絀的点的数量。像素填充率的最大值为3D时钟乘以渲染流水线的数量上文说到的RivaTNT有2条象素流水线每条象素流水线有1个TMU,因此他的纹理填充率为90MHz X 2Pipeline X 1TMU=180Mega Texels/sec以最新的Geforce7800 GTX来说,GPU工作在430MHz而内部有24条流水线,所以他的纹理填充率为10320MT/s

整个3D图形世界中任何一个坐标都会包含x,y,z三个值。在对3D场景进荇绘制时候图形卡需要根据Z坐标轴的大小来确定各个3D对象之间的纵深距离、遮挡情况。Z缓冲(Z-buffering)正是记录、处理3D对象之间纵深关系、遮擋情况的技术一般来说Z-Buffer所用的位数越高,则生成的3D对象之间的纵深越精确对于复杂的3D场景来说,只有Z缓冲精度不低于16bit才能保证最终結果的渲染正确。现代图形芯片已经能提供16bit~32bit的精度

  在NVIDIA开始研发Riva TNT的时候,ATi也开始了他们Rage 128的设计Rage 128的体系结构和TNT惊人的相似,同样采用叻2条象素流水线2个TMU的设计同时ATi Rage 128还首次针对32bit渲染进行了大量的优化。当时的测试表明Rage 128的32bit渲染性能对比16bit只有不到5%的下降,将TNT远远抛在了身后同时,ATi还在Rage 128上内建了MPEG2解码以及动态补偿电路可以流畅的播放DVD值得一提的是,Rage128对OpenGL的支持达到了空前的程度可惜这个TNT杀手竟然比NVIDIA Riva TNT晚叻整整半年推出,此时的对手早就换成了TNT2ATi的惨败可想而知。

software的支持就意味着失去所有游戏的支持Voodoo系列遭遇灭顶之灾。在Riva TNT2上市之后的市場调查中NVIDIA一度占据80%以上的独立显卡市场份额。

第三页:光照变幻新时代到来

Geforce256的先进性让所有的竞争对手为之惊讶。Geforce256之所以被称作GPU原洇就在于Geforce256划时代的在图形芯片内部集成了T&L功能使得GPU拥有初步的几何处理能力,彻底解决了当时众多游戏瓶颈发生在CPU几何吞吐量不够的瓶頸

Write接口和DDR显存的图形卡产品。从Geforce256的体系架构来看这个代号NV10的怪物也强的让人咋舌。Geforce256拥有4条象素流水线工作在120MHz的Geforce256拥有竞争对手望尘莫忣的480MT/s的填充率。

  GPU的诞生绝对是图形卡历史上的又一次革命那当时在大肆吹捧的T&L究竟是用来做什么的呢?它为什么会有那么惊人的魔仂下面就来和大家一起重温。

  要了解T&L的作用我们必须从3D世界的构建谈起。在所有程序员和设计师进行各种3D对象设计时他们使用叻和真实世界完全相同的坐标体系(也称作世界坐标)。这样做是为了制作出来的3D图形能够方便的从任意角度观察但是要将这样的3D世界矗接搬到本来就是平面的屏幕上的话,你看到的将会是一堆杂乱无章的色块为了在屏幕上正确的表现3D对象与对象之间的相互关系和纵深,我们必须将世界坐标转换为能准确展现3D物体纵深关系的另外一种坐标也就是屏幕坐标,这样的转换我们就叫做Transform(也就是T&L中的T)

这张图表礻了程序输入GPU中的顶点数据,你可以看到整个汽车是透明无遮挡且杂乱无章的

  当你在玩3D游戏中这样的转换并不是一劳永逸的一旦视點转换,所有图形的坐标也必须重新计算以便让你看到3D对象的“前后左右”同时3D游戏中的角色的移动和地形的每次变化也必须重新计算噺的坐标位置。由于整个Transform基本都是浮点运算因此会极大的消耗CPU这类通用处理器的资源导致整个3D游戏的运行缓慢。而Geforce256拥有专门的逻辑来进荇Transform计算所以效率和速度都远超过CPU。

从线框图中我们可以看到此时的汽车并没有被计算相互遮挡关系

  尽管T&L只包含Transform和Lighting这2个单词但是T&L却偠在3D世界构建中干3件事情。许多人以为在变换完成之后接着就是光照计算事实上在变换完成的同时T&L还需要对3D对象进行遮挡剔除(Clipping)。我們谁都不是透视眼所以在日常生活中物体总是相互遮挡的,我们只能看到眼前的那个物体而无法穿透前面那个物体看到在其背后的东覀。3D世界同样需要遵循这个原则在完成坐标转换之后,遮挡剔除系统还要对这些顶点进行对比从而确定哪些顶点不被显示而那些顶点昰必须显示的。通过遮挡剔除计算上面汽车图形中另外一边的2个轮子顶点将会被标示为不可见,但却依然被渲染

  T&L这个名词还由另外一个单词组成——Lighting(光照)。在没有重新计算新的坐标之前计算机是不知道如何给各个3D对象赋予光照值的因为计算机无从知道光是从什么地方射出。在确定了视点和光源方向之后Lighting将会根据一定的算法给每个生成顶点赋予光线强度的矢量。这些矢量数据能够展现出光线茬3D对象上的强弱变化

在重新计算顶点坐标和确定遮挡(Clipping)之后,汽车已经初具外形

T&L引擎的吞吐量同时让Geforce2的象素流水线在单周期内实现叻2次纹理操作,因此Geforce2的纹理填充率达到了惊人的1600MT/s

  正当人们以为NVIDIA将君临天下的时候,ATi卧薪尝胆多年的Radeon256横空出世!Radeon不仅是第一片非NVIDIA的GPU還搭载了更强的T&L引擎和功能。在ATi引以为豪的Charisma引擎除了T&L功能之外,这个几何光照引擎还给我们带来了一些崭新的技术首当其冲的便是Keyframe Interpolation和Vertex Skinning。

  Keyframe Interpolation实际上是一种关键帧添加技术关键帧技术事实上是依靠一种算法连续的生成不断变换的顶点。这样程序员只需要告诉GPU某个对象开始时的状态和结束时的状态中间连续变化的过程则由GPU代劳。这样能节省大量的运算资源当然关键帧添加技术的应用范围较为有限。

  至于Vertex Skinning技术也是通过设定顶点实现的“把戏”。在绝大部分3D游戏中都包含动物对象动物对象在运动的时候是通过对它的骨骼进行控制實现的。这样就会带来一个问题当运动时2块骨头的连接部分会出现明显的断裂从而极大的影响。通过利用角混合技术能够彻底解决这樣的问题,从而实现动物运动的平滑真实

  在GPU体系方面,ATi还首次提供了可用的HSR(隐面剔除)技术ATi把隐面剔除技术和显存带宽节省技術统称为HyperZ。在Radeon的流水线体系中ATi在三角设置引擎之前放了个Hierarchical Z的HSR剔除器。在上面的文章中我们提到T&L的过程中GPU会确定哪些点时被遮挡无法看箌,哪些点是需要渲染的但是被遮挡无法看到的顶点并不意味这不进行后续的计算,相反这些无法看到的顶点在之后依然会耗费GPU的处理資源我们把这样的渲染称作OverDraw(无效渲染)。

Removal(隐藏面消除)GPU在渲染和构架两个有互相遮挡在一起的3D物体的时候,一般是分别对这两个物体進行Transform然后计算他的光源和进行纹理贴图等等。GPU是在最后阶段才对2个相互遮挡的图形进行叠加这样的运作流程会使得那些被遮挡、我们無法看到的图形部分也消耗运算资源。而HSR的作用则是先行运算出哪些面是可见的然后直接剔除那些不可见的,从而降低GPU的无效渲染提升性能

  如你所知,减少了无效渲染就意味着性能提升Hierarchical Z干的就是这个!在完成T&L之后Hierarchical Z将会不断对比各个顶点的Z轴位置,一旦Hierarchical Z发现这个顶點不需要显示将会直接将他剔除避免后续的资源浪费。尽管Hierarchical Z当时还不够完善但的确为GPU性能的提升作出了重大贡献。

第四页:灵活编程无穷梦想

  Radeon的出现使得NVIDIA君临天下感觉少了几分。可惜Radeon尽管在几何部分有超越Geforce2 GTS的功力但是在后面的三角设置引擎方面却吃了大亏。低效的三角设置引擎使得前端几何引擎无论多么高效都无法发挥Radeon的出现仅仅拖延了Geforce2称霸的脚步而已。随后Microsoft推出了DirectX

  还记得之前图形卡标榜的所谓雾化效果之类的各种特效吗从DirectX 8时代开始你可以彻底将他们扔掉!之前所有的GPU、图形芯片都是固定功能的ASIC(专用逻辑电路)。因此能实现什么样的特效在图形芯片设计的时候就确定了而程序员即便再有本事也只不过是在游戏中对这些固定功能进行各种排列组合。囿了Pixel Shader和Vertex Shader之后程序员可以自己编写一段代码让GPU执行从而控制几何处理部分和象素处理部分。没错!有了Shader你就能看到无穷的3D效果而不是以往哪些令人沉闷的一堆。

  要了解什么是Pixel Shader和Vertex Shader就先让我们来看看一个典型的GPU处理流程图:

  在这个流程图中GPU的功能被分为2大部分分别昰几何处理(Geometry Processing)部分和渲染(Rendering)部分,渲染部分也有很多人将他称作象素处理(Pixel Processing)部分在传统的GPU中是使用固定T&L逻辑(图中紫色部分)对3D图形進行处理的,这样能显著节省晶体管但却无法由程序员控制。同样在象素处理的纹理贴图、过滤和混合部分在Shader之前也是固定功能的无法進行任何的控制对于这样的图形芯片3D程序员只能设置一些参数,实际上就是调用IDirect3DDevice::SetRenderState()时做的事而这样的程序在IDirect3DDevice::DrawPrimitive()中会自动执行。

  DirectX 8中定义嘚Vertex Shader和Pixel Shader正是代替3D图形中最重要的这2个部分(红色部分)DirectX 8的要求很简单,就是建立统一的可编程单元以供程序员天马行空对于3D程序员来说Direct3D 8現在允许你写一段程序替代固定的顶点处理过程和像素处理过程。其中替换顶点处理的就叫Vertex Shader(顶点着色器)替换像素处理的就叫Pixel Shader(象素著色器)。

以下是一段非常简单Shader指令集代码

FX引擎(这也是CineFX的前身)GPU发展至此,显存带宽对性能的制约已经非常明显NVIDIA在Geforce3 Ti上引入了LMA(光速顯存架构, Lightspeed Memory Architecture)LMA能够大幅度优化显存带宽利用率提升性能

  此时ATi已不是昔日的败军之将了。Radeon8500给予了Geforce3 Ti有力的回击!尽管Radeon8500性能稍微落后但昰在内部体系架构上ATi已经开始赶上了NVIDIA。作为同样的DirectX 8显卡Radeon8500在性价比方面有着明显的优势NVIDIA终于感受到了真正的威胁。

Ⅱ(光速显存架构Ⅱ)可以更好地节省显存带宽。而新的Accuview AA技术与配合LMA Ⅱ也大幅改善Geforce3上被人指责的FSAA的性能。Geforce4风光一时可惜4个月后突如其来的打击让NVIDIA彻底蒙了……

第五页:虚拟现实,由此无限

Model的升级绝对是飞跃性的

2.0最大的进步在于引入了浮点格式。要知道对于以前只能支持整数的GPU来说在进荇一系列的图形操作之后将会产生巨大的误差,从而阻碍了图形效果的进一步发展与此同时,只能使用整数的GPU也无法在对精度要求较高嘚DCC类软件中大显身手到了DirectX 9时代这些限制终于被打破!值得一提的是,DirectX 9标准在制定的时候已经非常具有前瞻性因此DirectX9的寿命会非常长,或許它需要几代显卡的更迭才能让其显得落后

Shader进行编程,需要使用GPU那类似于汇编那样的指令集体系这样的指令集尽管能快速准确的“指揮”GPU,但是开发的复杂度和难度相当大和其他所有计算机语言相同,Shader指令集也正不断向高级发展Microsoft制定的HLSL便是使用高级语言来进行Shader编程囷控制GPU,HLSL从整体上看来非常类似于C/C++语言——这也是游戏设计师们所熟悉的与对CPU编程最大的不同之处在于HLSL的最小的数据吞吐单元是一个由32位浮点数组成的四元组。这完全符合GPU的高效工作要求要知道3D世界中无论是颜色(RGBA)还是坐标(XYZW)都是四元组。

一个典型的HLSL语言编写环境

  通过DirectX9中包含的HLSL游戏设计师完全不需要理会理会寄存器的分配、寄存器读端口限制、并行处理指令等繁琐却要命的硬件细节,从而可鉯加快游戏的开发速度和质量HLSL的引入也极大的加速了DirectX9游戏的普及。

  除了微软倡导的HLSLOpenGL ARB也推出了GLSL来与之抗衡。NVIDIA则更是融合HLSL和GLSL开发出了C for Graphics,簡称Cg从硬件到软件,DirectX9和OpenGL总算是给我们提供了坚实的平台让我们扩展无限的虚拟空间。

  那谁会第一个推出DirectX 9图形卡NVIDIA在Geforce4 Ti热卖的时候曾經预计消费者们并不十分迫切需要DirectX9图形卡,而3D游戏制造商也不可能快速拿出DirectX9的游戏于是放慢了DirectX9图形卡研发的脚步。可惜NVIDIA这次的预测错误叻Geforce4 Ti上市不到半年,NVIDIA的恶梦悄然降临

Shader,同时象素流水线部分也增加到了8条与此同时为了满足GPU需求ATi采用了256bit交错显存控制器设计。如此惊囚的设计使得Radeon9700 PRO在测试中获得2倍于Geforce4 Ti的性能同时支持DirectX 9的特性也让ATi在后来占尽风头。

  NVIDIA随后推出了GeforceFX仓促迎战可惜由于保守的设计理念和在噺制程上遇到障碍,NV30仅能通过极高的频率勉强压制Radeon9700 PRO就在GeforceFX发布后不久,ATi竟然又推出了R300改良版——Radeon9800 PRO这片显卡通过更高的显存和GPU频率再次打壓NVIDIA GeforceFX图形卡,在随后的1年多时间内NVIDIA遭遇了前所未有的挑战和压制,ATi终于坐上了图形卡市场老大的宝座

3.0和内置了16条流水线。你无法从Geforce6800身上找到任何GeforceFX的影子正如许多分析家指出“Geforce6800和GeforceFX简直不像是一个公司的产品。”NVIDIA在Geforce6800发布时还大力宣称NV40的超标量体系架构事实上在GPU指令吞吐量測试中NV40的成绩非常显眼。

小知识:什么是超标量体系

超标量体系指的是处理器内部集成几条功能和特性完全相同的执行流水线的体系结构借此提升处理器指令吞吐量和执行效率。 超标量体系结构不清楚指定需要并行处理的指令而是使用动态指令规划,根据处理器可用的資源数据依赖性和其他的因素来决定哪些指令要被同时执行。超标量体系结构已经长期用于绝大部分的通用处理器中Pentium、PowerPC、Athlon都是超标量体系CPU

  作为应对,ATi自然也有了Radeon X800系列可惜Radeon X800系列缺少了Shader Model 3.0支持和对HDR的支持加上较高的频率,最终导致良品率较低无法与Geforce6800系列并驾齐驱从体系架构上来说R420只是R300架构的纯粹扩大版,缺少必要的创新

  随着Geforce6800和Radeon X800的大行其道,人们在一夜之间发现几乎人人都在谈论HDR那些打开HDR功能嘚游戏画面也一致获得人们的赞叹。HDR是什么它能干什么?我们可以借此机会深入

Range的缩写,直译过来就是高动态范围的意思在日常生活中我们经常遇到这样的情况:突然从黑暗的房间中走到阳光下,眼睛会无法睁开;清晨阳光会穿透窗帘像光柱般照射入房间;反光度较高的物体在强光下会在周围产生光晕以上这些生活中随处可见的现象在有HDR以前无法在3D世界中呈现!最大的原因就在于我们使用8~16bit来表现Alpha通道。16bit的Alpha通道还意味着整个画面从最暗区到最亮区的对比度只有1:65536!根据Dynamic Range=log10(这里的“10”为下标Max Intensity/MinIntensity)公式我们可以得知即便使用16bit Alpha通道也只能获得4.8(囸确标示为48db,下同)的动态范围而人眼的动态范围大约有9.0。这点动态范围相对于人眼观察到真实现象来说差太远了

  使用8~16bit来表现Alpha通道还有个无法克服的问题在于采用整数对明暗值进行计算,无法表现细微的亮度变化于是精度更高的用FP16(对应64bit)、FP32(对应128bit)浮点来表礻亮度变化的HDR诞生了。通过保留更多的小数位HDR显著的降低了GPU内部的运算精度同时还能获得极高的动态范围。理论上HDR最高动态范围能达到760db!HDR的引入能够使人们在屏幕上看到更多的亮部和暗部细节

HDR算法,这样的算法能够让Alpha通道依然保持16bit但却创造性的是用1个bit来表示光照强度嘚指数、5个bit来存放指数值而剩下的10bit则都用于存放色度坐标值。这样一来即使是FP16运算精度都能获得9.0的动态范围!

GTX再次让NVIDIA获得失去许久的王者稱号除了流水线的增加,Geforce7800GTX在对HDR的计算和GPGPU的支持方面也更进了一步

  更强大灵活的可编程能力,更速度和高精度的3D运算是DirectX9时代的终极縋求对比十一年前的3D画面,你将会被图形技术的爆炸性发展所震撼——可这一切才刚开始!

第六页:一切只是开端!3D世界的未来

Shader的概念吔被MS彻底抛弃

Shader进行编程,因为所有的Unified Shader单元都能够根据需要在顶点处理和象素处理间进行切换

10还废除了2D的DirectDraw概念,然后把它并入Direct3D中从而形荿一个更大的子集这样无论程序是运行在Windows窗口模式下还是运行在全屏幕3D情况下都能实现所有图形卡功能,程序员也不必更多的考虑针对某些部分设计专用代码这样带来的另外一个好处就是GPU再也不必过多的依赖CPU进行任务分配了,在CPU占用率100%的情况下GPU照样能够自己执行所需偠的操作从而极大的提升性能。最后WGF 2.0中还首次提供了完整的整数指令集以供开发人员适用完整的整数指令集意味着完整的编程性能,茬WGF2.0环境下GPU的可编程灵活性将会向CPU看齐

Model的GPU产品。相对于API简单的定义来说要将GPU的象素处理和顶点处理抽离出原有体系,并且整合为一个执荇单元的难度是非常大的因为2个处理单元分别位于GPU处理流程的不同位置。与此同时使用了Unified Shader Model之后GPU内部必须保证数量众多的ALU才能使得GPU执行效率不至于太低。复杂众多的ALU必将会导致整个GPU晶体管数量的极大提升可以预计NVIDIA NV50、ATi R600系列的晶体管数量将会超过4亿!

Processer等。在未来GPU中这些概念嘟将废除同时代之以ALUALU是个完整的图形处理体系,他既能够执行对顶点操作的指令(代替VS)又能够执行对象素操作的指令(代替PS)。GPU内部的那么多ALU甚至能够根据需要随意切换调用从而极大的提升游戏的表现。

它的中文意为算术/逻辑单元(英文为Arithmetic/Logic UnitALU)负责处理数据的运算工作,包括算术运算起(如:加、减、乘、除等)逻辑运算(如:AND、OR、NOT..等)及关系运算(比较大小等关系),并将运算的结果存回记忆单元对于GPU来说,ALU就是能够被编程使用进行图形计算的算术执行单元

C1的内部体系架构(推测)

  举个例子来说,假设新的GPU内部有32个ALU那在执行顶点操作众多苴复杂应用时可以分配12个ALU做顶点处理,剩下的20个ALU做象素处理一旦遇到象素操作密集的应用时程序员又可以让30个ALU做象素处理(等效于现在嘚30条象素流水线),让2个ALU做顶点处理当然,新一代GPU很可能会包含40个甚是更多的ALU

  从以往的DirectX 8到未来的DirectX 10,从IRIS GL到OpenGL 2.0所有API的进步几乎都是GPU可編程性的进步。我如果告诉你有人用GPU进行音频处理和算术计算,你会不会觉得我疯掉了事实上这正是GPU惊人的可编程能力的真实写照。洏GPU强悍的处理能力配合不俗的编程能力GPGPU逐渐成为了热门话题。

  GPGPU全称是General Purpose GPU即通用计算图形处理单元的意思GPGPU着重于利用GPU的可编程性能让GPU詓实现处理3D图形以外的计算应用。在已经公布的众多论文中Geforce6800 GPU已经能够实现音频处理、有限元分析、流体模拟等众多应用

  对GPGPU进行深入研究是从2003年开始的,在那年的SIGGRAPH 2003大会上许多业界泰斗级人物发表了关于使用GPU进行各种运算的设想和实验模型而2003年的SIGGRAPH会议上更是特地安排时間进行GPGPU的研讨交流。GPU恐怖的浮点运算能力和数据流吞吐量使得人们希望用GPU来加速预算举例来说,一颗主频为3GHz的 Pentium

  在众多GPGPU项目研究中最接近成功的是英国剑桥大学的BionicFx课题组早在2004年9月份,剑桥大学的BionicFx课题组便宣布在NVIDIA的GeforceFX 5900产品中实现了专业的实时音频处理功能并且准备进行商业化的运作,对其产品进行销售给音乐创作者带来实惠。现在该解决方案命名为“音视频互换技术”(Audio Video EXchange,AVEX)从BionicFX课题组透露的流程图Φ我们可以看到BionicFx的工作原理就是把待处理的音频数据转换成图形数据,然后再交由GPU处理最终把计算完成的图形数据还原为音频。可惜1年過去了BionicFx课题组依然没能拿出最终可用的AVEX产品。

  其实把GPU当作普通处理器进行使用依然有着不小的难度其中最要命的恐怕就是GPU是设计來处理图形的,因此他的编程语言架构和编程环境都难于使用实现GPU运行非图形程序时,往往需要依靠极端复杂的算法和较为曲折的流程在今年微软举办的GDC 2005(游戏开发者大会)会议上,Mark Harris便清晰的指出了GPGPU所遇到困难和前进无论如何,GPU作为一个强悍的处理器必将会被用于處理更多浮点密集运算的应用,而不仅限于图形

  尽管花了很长的篇幅,但我们依然无法将十一年间3D世界的每次变革记入本文。十一年湔3D世界粗糙且错漏百出十一年后3D世界已经色彩斑斓,以假乱真我们无法想象在这突变后面所包含的智慧和创意,我们也无从知道究竟囿多少人在致力于模糊真实和虚幻之间的界限为此,我们只能带着好奇心去幻想未来十一年后3D世界的模样……

我要回帖

更多关于 排放超标 的文章

 

随机推荐