ATi Radeon 8500

HyperZ II

Da die Bandbreite (Speicher und AGP-Bus) das größte Problem heutiger Grafikkarten ist, musste sich auch ATi etwas einfallen lassen, also wurde vom R100 (alte Radeon) das HyperZ übernommen und ein wenig verbessert. Somit besitzt die Radeon 8500 statt der 8,8 GB/s (bei 275 Mhz) ca. 11-12 GB/s Speicherbandbreite.
  • schnelles Z-Buffer Löschen (Fast Z-Clear)
  • verlustfreie Z-Daten Kompression (Z-Compression)
  • hierarchischer Z-Buffer (Hierarchical Z-Buffer)

HyperZ II

Fast Z-Clear

Hierbei handelt es sich um einen recht einfaches Prinzip, nämlich den Z-Buffer möglichst schnell zu löchen. Je kürzer der Z-Buffer durch den Löschvorgang blockiert wird, desto schneller kann der nächste Pixel berechnet werden.

Fast Z-Clear

Z-Compression

Z-Daten machen eine großen Teil der beanspruchten Bandbreite aus. Hierzu eine kleine Rechnung, die verdeutlicht, wieviel Prozent der Speicherbandbreite von den Z-Daten benötigt werden:

RZ - Z-Daten aus dem Z-Buffer lesen
WZ - Z-Daten in den Z-Buffer schreiben
RC - Farbwert aus dem Framebuffer lesen (zwecks Alpha-Test)
WC - Farbwert in den Framebuffer schreiben
TR - Texturepixel aus dem Speicher lesen

jeweils 4 Byte, bei 32 Farbtiefe und 32 Bit Z-Buffer (24 Bit Z-Daten / 8Bit Stencil Daten, denn es können nicht nur 24 Bit gelsesen werden!)
  • schlechtester Fall:
    • RZ+WZ+RC+WC+TR= 20 Bytes/Pixel
    • 40% - 8/20 Bytes werden für Z-Daten benutzt
  • durchschnitts Fall:
    • RZ+WZ+WC+TR= 16 Bytes/Pixel
    • 50% - 8/16 Bytes werden für Z-Daten benutzt
  • bester Fall (Z-Test schlägt fehl):
    • RZ= 4 Bytes/Pixel
    • 100% - 4/4 Bytes werden für Z-Daten benutzt
Durch die Kompression der Z-Daten (bis zum Faktor 4) wird enorm Bandbreite eingespart, besten Falls 75 %.

Hierarchical Z-Buffer

Durch einen frühzeitigen Z-Test wird versucht, zu bestimmen, ob ein Pixel sichtbar ist, oder nicht. Dies wird durch eine Front-to-Back (von vorne nach hinten) Sortierung begünstigt, die allerdings vom Programmierer zu erledigen ist, was bei heutigen CPU's kein Problem mehr darstellt, da viele 3D-Engines die Szenen nach Objekten sortieren, welche dann von vorne nach hinten gerendert werden. Bei NVIDIA nennt sich eine ähnliche Technik Z-Occulsion Culling. Auf der Grafik kann man sehen, wo der Z-Test (HZ buffer)  in der Pipeline ansetzt. Diese Verfahren kann bis zu 64 Pixel pro Takt einsparen. Bei der alten Radeon (R100) lag dieser Wert noch bei etwa 8.

früher Z-Test

Truform

Bei Truform handelt es sich um eine Technik, welche N-Patches verwendet. N-Patches sind Flächen höherer Ordnung ( Higher Order Surfaces). Sie haben den großen Vorteil, dass man nur wenige Eckpunkte zur Grafikkarte transferieren muss, was den AGP-Bus entlastet. Der GPU errechnet, aus diesen wenigen Punkten, dann eine Fläche, welche aus wesentlich mehr Dreiecken bestehen kann, als man mit den Eckpunkten hätte repräsentieren können. Diese Technik ist recht einfach in aktuelle Spiele einzubauen. Für Serious Sam wurde gerade ein neues Patch (1.05) fertig, mit welchem man Truform nutzen kann. NVIDIA's GeForce 3 setzt auf eine andere Art von Higher Order Surfaces (HOS), welche momentan noch in keinem Spiel verwendet wird.

N-Patch (Higher Order Surface)

N-Patch (Higher Order Surface)

3D-Texturen

Auf 3D-Texturen bin ich in meinem ASUS GeForce 3 Deluxe Review eingegangen. Sie werden aber bisher kaum eingesetzt.


<< vorherige Seite
                                                                        nächste Seite >>