Gtx 280 număr de procesoare shader. Resursa informatică U SM

Cu toate acestea, în primul rând, despre caracteristicile tehnice. Fiind o dezvoltare logică a seriei GeForce 8 și GeForce 9, care au reprezentat prima generație a arhitecturii unificate de calcul vizual NVIDIA, noile produse din familia GeForce GTX 200 se bazează pe a doua generație a acestei arhitecturi.

GPU-urile NVIDIA GeForce GTX 280 și 260 sunt cele mai masive și complexe cipuri grafice cunoscute vreodată - nu glumă, 1,4 miliarde de tranzistori fiecare! Cea mai productivă soluție este GeForce GTX 280, care are 240 de procesoare shader, 80 de procesoare de textură și acceptă până la 1 GB de memorie video. Caracteristicile detaliate ale cipurilor GeForce GTX 280 și GeForce GTX 260 sunt prezentate în tabelul de mai jos.

Specificații NVIDIA GeForce GTX 280 și GTX 260
Nucleul grafic
Standarde de proces
Numărul de tranzistori
Viteza ceasului grafic (inclusiv dispecer, module de textură și ROP)
Frecvențele de ceas ale modulelor procesorului
Numărul de module de procesor
Viteza ceasului memoriei (frecvență/date)	1107 MHz / 2214 MHz	999 MHz / 1998 MHz
Lățimea interfeței memoriei
Lățimea de bandă a magistralei de memorie
Capacitate de memorie
Numărul de module ROP
Numărul de module de filtrare a texturii
Performanța modulelor de filtrare a texturii	48,2 Gigatexeli/s	36,9 Gigatexeli/s
Suport HDCP
Suport HDMI	Da (adaptor DVI-HDMI)
Interfețe	2 x Dual-Link DVI-I 1 x HDTV cu 7 pini
RAMDAC, MHz
Obosi
Factor de formă	Două sloturi
Configurația conectorului de alimentare	1 x 8 pini 1 x 6 pini	2 x 6 pini
Consum maxim de energie
Limită de temperatură a GPU

De fapt, nucleul grafic modern al familiei GeForce GTX 200 poate fi gândit ca un cip universal care acceptă două moduri diferite - grafică și calcul. Arhitectura cipurilor din familia GeForce 8 și 9 este de obicei reprezentată de matrice de procesoare scalabile (Scalable Processor Array, SPA). Arhitectura familiei de cipuri GeForce GTX 200 se bazează pe o arhitectură SPA modificată și îmbunătățită, constând dintr-un număr de așa-numite „clustere de procesare a texturii” (TPC, Texture Processing Clusters) în modul grafic sau „clustere de procesare a firelor” în modul de calcul paralel. Mai mult, fiecare modul TPC constă dintr-o serie de multiprocesoare de streaming (SM, Streaming Multiprocessors), iar fiecare SM conține opt nuclee de procesor, numite și procesoare stream (SP, Streaming Processor) sau procesoare thread (TP, Thread Processor). Fiecare SM include, de asemenea, procesoare de filtrare a texturii pentru modul grafic, utilizate și pentru diferite operații de filtrare în modul de calcul. Mai jos este o diagramă bloc a GeForce 280 GTX în modul grafic tradițional.

Trecând la modul de calcul, managerul de fire hardware (mai sus) gestionează firele de execuție TPC.

O privire mai atentă asupra clusterului TPC: memorie distribuită pentru fiecare SM; Fiecare nucleu de procesor SM poate distribui date între alte nuclee SM prin intermediul memoriei distribuite, fără a fi nevoie să accesați un subsistem de memorie extern.

Astfel, arhitectura unificată de shader și computer NVIDIA utilizează două modele de calcul complet diferite: pentru operarea TPC se folosește MIMD (instrucțiune multiplă, date multiple), pentru calcule SM - SIMT (instrucțiune unică, fir multiplu), o versiune avansată, SIMD (instrucțiune unică, instrucțiune, date multiple). În ceea ce privește caracteristicile generale, comparativ cu generațiile anterioare de cipuri, familia GeForce GTX 200 are următoarele avantaje:

Abilitatea de a procesa de trei ori mai multe fluxuri de date pe unitate de timp
Design nou al programatorului de comenzi, cu o eficiență crescută de procesare a texturii cu 20%.
Interfață de memorie de 512 biți (384 de biți pentru generația anterioară)
Proces optimizat de eșantionare și compresie z pentru a obține rezultate de performanță mai bune la rezoluții mari ale ecranului
Îmbunătățiri arhitecturale pentru a îmbunătăți performanța procesării umbrelor
Amestec de memorie tampon de cadre la viteză maximă (față de jumătate de viteză pe 8800 GTX)
Dublați tamponul de comandă pentru performanțe de calcul îmbunătățite
Dublați numărul de registre pentru o procesare mai rapidă a shader-urilor lungi și complexe
Date cu virgulă mobilă de dublă precizie conform versiunii standard IEEE 754R
Suport hardware pentru spațiu de culoare pe 10 biți (numai DisplayPort)

Aceasta este lista cu principalele caracteristici ale noilor cipuri:

Suport NVIDIA PhysX
Suport Microsoft DirectX 10, Shader Model 4.0
Suport pentru tehnologia NVIDIA CUDA
Suport pentru magistrala PCI Express 2.0
Suport pentru tehnologie GigaThread
Motor NVIDIA Lumenex
virgulă mobilă pe 128 de biți (HDR)
Suport pentru OpenGL 2.1
Suport DVI dual-link
Suporta tehnologia NVIDIA PureVideo HD
Suport pentru tehnologia NVIDIA HybridPower

Se remarcă separat faptul că DirectX 10.1 nu este acceptat de familia GeForce GTX 200. Motivul invocat a fost faptul că la dezvoltarea cipurilor unei noi familii, după consultări cu partenerii, s-a decis să se concentreze nu pe suportarea DirectX 10.1, care este încă puțin solicitat, ci pe îmbunătățirea arhitecturii și performanței cipurilor. Bazat pe o suită de algoritmi de fizică, tehnologia NVIDIA PhysX este un motor fizic puternic pentru calcul în timp real. În prezent, suportul PhysX este implementat în peste 150 de jocuri. Combinat cu un GPU puternic, motorul PhysX oferă o creștere semnificativă a puterii fizice de calcul, mai ales în momente precum crearea de explozii cu zburarea de praf și schije, personaje cu expresii faciale complexe, noi tipuri de arme cu efecte fantastice, țesături uzate sau rupte în mod realist. , ceață și fum cu flux dinamic în jurul obiectelor. O altă inovație importantă este noile moduri de economisire a energiei. Datorită utilizării tehnologiei de proces de precizie de 65 nm și a noilor soluții de circuite, a fost posibil să se obțină un control mai flexibil și mai dinamic al consumului de energie. Astfel, consumul familiei de cipuri grafice GeForce GTX 200 în modul standby sau în modul 2D este de aproximativ 25 W; la redarea unui film Blu-ray DVD - aproximativ 35 W; la încărcare 3D completă, TDP-ul nu depășește 236 W. Cipul grafic GeForce GTX 200 poate fi complet dezactivat datorită suportului tehnologiei HybridPower cu plăci de bază pe chipset-urile nForce HybridPower cu grafică integrată (de exemplu, nForce 780a sau 790i), în timp ce fluxul grafic de intensitate scăzută este calculat pur și simplu de GPU-ul integrat în placa de bază. În plus, GPU-urile din familia GeForce GTX 200 au și module speciale de control al puterii concepute pentru a opri unitățile GPU care nu sunt utilizate în prezent.

Utilizatorul poate configura un sistem bazat pe două sau trei plăci video din familia GeForce GTX 200 în modul SLI atunci când folosește plăci de bază bazate pe chipset-urile nForce corespunzătoare. În modul tradițional Standard SLI (cu două plăci video), se declară o creștere de aproximativ 60-90% a performanței de joc; în modul SLI cu 3 căi – numărul maxim de cadre pe secundă la rezoluțiile maxime ale ecranului.

Următoarea inovație este suportul pentru noua interfață DisplayPort cu rezoluții mai mari de 2560 x 1600, cu un spațiu de culoare de 10 biți (generațiile anterioare de grafică GeForce aveau suport intern pentru procesarea datelor pe 10 biți, dar doar culorile componentelor RGB de 8 biți erau ieșire). Ca parte a anunțului noii serii de procesoare grafice GeForce GTX 200, NVIDIA oferă o privire complet nouă asupra rolului procesoarelor centrale și grafice într-un sistem desktop echilibrat modern. Astfel de PC optimizat pe baza conceptului calcul eterogen (adică calcularea unui flux de sarcini eterogene de diferite tipuri), conform experților NVIDIA, are o arhitectură mult mai echilibrată și un potențial de calcul semnificativ mai mare. Aceasta se referă la combinația unui procesor central cu performanțe relativ moderate cu cea mai puternică grafică sau chiar un sistem SLI, care vă permite să obțineți performanțe de vârf în cele mai solicitante jocuri, aplicații 3D și media. Cu alte cuvinte, conceptul poate fi formulat pe scurt astfel: procesorul central într-un sistem modern preia funcții de serviciu, în timp ce povara calculelor grele revine sistemului grafic. Aproximativ aceleași concluzii (deși mai complexe și fundamentate numeric) sunt observate într-o serie de articole noastre dedicate cercetării dependenței performanței de elementele cheie ale sistemului, vezi articolele Dependența de procesor a unui sistem video. Partea I - Analiză; Dependența de procesor a sistemului video. Partea a II-a - Impactul dimensiunii cache-ului CPU și al vitezei RAM; Dependența de bot sau de ce jocurile 3D au nevoie de un procesor puternic; Dependența de procesor a sistemului video. Regiunea de tranziție. Punctul „critic” al frecvenței CPU. Cu toate acestea, calculul intensiv folosind plăci grafice moderne nu este nou, dar odată cu apariția familiei de procesoare grafice GeForce GTX 200, NVIDIA se așteaptă la o creștere semnificativă a interesului pentru tehnologia CUDA. CUDA (Compute Unified Device Architecture) este o arhitectură de calcul care vizează rezolvarea problemelor complexe din sfera consumatorilor, afacerilor și tehnică - în orice aplicație cu consum mare de date folosind GPU-uri NVIDIA. Din punctul de vedere al tehnologiei CUDA, noul cip grafic GeForce GTX 280 nu este altceva decât un puternic procesor multi-core (sute de nuclee!) pentru calcul paralel. După cum sa menționat mai sus, nucleul grafic al familiei GeForce GTX 200 poate fi gândit ca un cip care acceptă grafică și moduri de calcul. Într-unul dintre aceste moduri - „computațional”, același GeForce GTX 280 se transformă într-un multiprocesor programabil cu 240 de nuclee și 1 GB de memorie dedicată - un fel de supercomputer dedicat cu performanțe teraflop, care crește semnificativ eficiența lucrului cu aplicații care paralelizează. date bine, de exemplu, codificare video, calcul științific etc. GPU-urile din familiile GeForce 8 și 9 au fost primele de pe piață care au suportat tehnologia CUDA acum peste 70 de milioane dintre ele au fost vândute și interesul pentru proiectul CUDA este în continuă creștere. Puteți afla mai multe despre proiect și puteți descărca fișierele necesare pentru a începe. Ca exemplu, capturile de ecran de mai jos arată exemple de câștiguri de performanță computațională obținute de utilizatorii independenți ai tehnologiei CUDA.

Pentru a rezuma scurta noastră examinare a îmbunătățirilor arhitecturale și tehnologice implementate în noua generație de GPU-uri NVIDIA, vom evidenția principalele puncte. A doua generație de arhitectură de calcul vizuală unificată prezentată în familia GeForce GTX 200 reprezintă o îmbunătățire semnificativă față de generațiile anterioare de GeForce 8 și 9.

Comparativ cu liderul anterior GeForce 8800 GTX, noul procesor emblematic GeForce GTX 280 are de 1,88 ori mai multe nuclee de procesor; capabil să proceseze aproximativ 2,5 fire de execuție mai mult pe cip; are o dimensiune dublă a registrelor de fișiere și suport pentru calcule cu virgulă mobilă cu precizie dublă; acceptă 1 GB de memorie cu o interfață de 512 biți; echipat cu un manager de comandă mai eficient și capacități de comunicare îmbunătățite între elementele de cip; Z-buffer și modul de compresie îmbunătățit, suport pentru paleta de culori pe 10 biți etc. Pentru prima dată, noua generație de cipuri GeForce GTX 200 este poziționată inițial nu doar ca un puternic accelerator grafic 3D, ci și ca o soluție serioasă de computer pentru calculul paralel. Este de așteptat ca plăcile video GeForce GTX 280 cu 1 GB de memorie să apară în retail la un preț de aproximativ 649 USD, produse noi bazate pe GeForce GTX 260 cu 896 MB memorie vor costa aproximativ 449 USD (sau chiar 399 USD). Se va putea verifica foarte curând în ce măsură prețurile recomandate coincid în comerțul cu amănuntul real, deoarece conform tuturor datelor, anunțul familiei GeForce GTX 200 nu este în niciun caz „de hârtie” soluții pe aceste cipuri au fost anunțate de mulți Partenerii NVIDIA, iar în viitorul foarte apropiat vor apărea noi produse pe rafturi. Acum să trecem la descrierea primei plăci video GeForce GTX 280 care a intrat în laboratorul nostru și la rezultatele testării acesteia.

Imaginea anterioară Următoarea imagine

O placă video cu performanțe destul de ridicate bazată pe nucleul grafic NVIDIA de generația a opta, care acceptă majoritatea tehnologiilor moderne. Potrivit pentru computere de acasă și stații de jocuri.

GPU-ul oferă performanțe ridicate pentru majoritatea jocurilor moderne pe computer, iar suportul PhysX vă permite să obțineți efecte speciale suplimentare în jocuri fără pierderi vizibile de performanță.

Suport bun pentru computerul universal CUDA / OpenCL / DirectX poate crește semnificativ productivitatea în sarcinile de codificare și editare video.

Avantaje

Performanță bună pentru jocuri Placa video vă permite să jucați toate jocurile moderne pe computer cu o calitate bună a imaginii. Suport SLI Posibilitatea de grupare cu una sau două dintre aceleași carduri (când utilizați o placă de bază compatibilă SLI) pentru a îmbunătăți și mai mult performanța jocurilor. Pregătit pentru 3D Vision Stereo Cardul are suficientă „marja de siguranță” pentru modul stereo complet în jocuri atunci când utilizați kitul NVIDIA 3D Vision (este necesar un monitor compatibil). Suport pentru accelerarea PhysX GPU-ul are suficientă putere pentru a calcula simultan grafică 3D și efecte speciale suplimentare în jocurile compatibile cu PhysX.

Defecte

Accelerarea incompletă pentru videoclipuri VC-1 Redarea unor discuri Blu-ray și videoclipuri pe Internet va depinde de puterea procesorului computerului dumneavoastră. Conectorul HDMI este opțional În majoritatea plăcilor video ale acestui model, pentru a conecta digital un echipament TV/video, trebuie să utilizați un adaptor separat și să conectați placa video la adaptorul de sunet cu un fir. Zgomot și consum de energie Placa video necesită o sursă de alimentare puternică și de înaltă calitate pentru computer. Zgomotul sistemului de răcire sub sarcină poate depăși ceea ce este confortabil. Lipsa suportului pentru DirectX 11 Cele mai recente efecte speciale din jocurile pe calculator nu vor fi disponibile, performanța în Windows 7 este limitată.

Chipset	GeForce GTX 280
Arhitectura GPU Nume de cod pentru microarhitectura GPU

Chipset

GeForce GTX 280

Arhitectura GPU

Nume de cod pentru microarhitectura GPU

Introducere

A trecut un an și jumătate - atât timp GeForce 8800 GTX a rămas în poziția pe care nVidia a numit-o GPU high-end. Desigur, la șase luni după anunț și (ce coincidență!) înainte de lansarea lui R600, am primit 8800 Ultra cu viteze ceva mai mari, dar nu au existat modificări revoluționare în el. Apoi, în urmă cu două luni și jumătate, introducerea lui 9800 GTX a stârnit speranțe de câștiguri semnificative de performanță, dar după cum s-a dovedit, cardul a oferit câștiguri foarte limitate față de vechiul GTX bun și a fost inferior versiunii Ultra. Nvidia a avut o perioadă foarte dificilă să convingă proprietarii de plăci video noi de beneficiile semnificative ale megahertzii suplimentari sau chiar să instaleze două GPU-uri pe o singură placă video.

În cele din urmă, nVidia a coborât și a auzit rugăciunile noastre: GTX 280 este prima placă video bazată pe arhitectura G8x cu adevărat modificată. Acum cunoaștem deja principiul activității companiei: prezentarea unei noi arhitecturi folosind un proces tehnic dovedit. Datorită numărului foarte mare de tranzistori, cip-ul este scump de produs, cardurile sunt și foarte scumpe, dar piața este în continuare capturată. Apoi, în anii următori, Nvidia își îmbunătățește arhitectura pe toate segmentele de piață, folosind o tehnologie de proces mai subțire, dar mai puțin optimizată pentru viteze mari de ceas. În cele din urmă, când noul proces tehnic este stăpânit, nVidia îl aduce la high-end, care până atunci devine mai accesibil. Am văzut o abordare similară cu G70/G71 și G80/G92, iar acum istoria se repetă cu GT200 - un adevărat „monstru” cu 1,4 miliarde de tranzistori, fabricat folosind o tehnologie de proces de 65 nm.

Noua generatie, nou nume. Se pare că producătorilor nu le place trecerea dincolo de numărul „10.000” din linie. În timp ce ATI a rezolvat această problemă prin introducerea numerelor romane, nVidia a decis să schimbe complet nomenclatura cardurilor. Acum avem GeForce 200 GTX. Dar apare o întrebare interesantă: ce s-a întâmplat cu placa GeForce 100 GTX?

	GTX 260	GTX 280
Frecvența GPU	576 MHz	602 MHz
Frecvența memoriei	999 MHz	1 107 MHz
Frecvența procesorului de flux	1 242 MHz	1 296 MHz
Numărul de procesoare de flux	192	240
Numărul de unități de textură	64	80
Numărul de unități de operare raster (ROP)	28	32
Controler de memorie	448 de biți (7 canale de 64 de biți)	512 biți (8 canale de 64 de biți)
Tipul memoriei	GDDR3	GDDR3

După cum putem vedea, nVidia introduce o nouă arhitectură, dar nu poate fi numită complet „de la zero”. G80 a pornit de la o pagină goală, dar apoi arhitectura și-a dovedit eficiența ridicată. Scopul lui GT200 a fost să corecteze toate „greșelile tinereții” ale arhitecturii, precum și să o pregătească pentru jocurile viitoare. Ceea ce avem este cam ceea ce a fost G70 pentru NV40, cu o mulțime de mici îmbunătățiri, precum și un pas mai mare în puterea de procesare. Acest lucru s-a întâmplat în cazul lui 8800 GTX cu o putere în virgulă mobilă de 518 GFlops, iar GTX 280 se apropie deja de un teraflop - cu un impresionant 933 GFlops. În realitate, decalajul este și mai mare, deoarece 518 GFlops ai lui G80 este proiectat să efectueze două operații în virgulă mobilă pe ceas (unul MAD și unul MUL) - ceea ce, din cauza limitărilor G80, a fost imposibil de realizat în practică. Odată cu lansarea lui GT200, nVidia garantează prin testare că problemele au fost rezolvate. Pentru a dubla aproape puterea de procesare a GPU-ului precedent, nVidia a crescut semnificativ numărul de multiprocesoare - de la 16 la 30.

Nvidia și AMD sunt de acord că jocurile viitoare vor necesita performanțe de procesare semnificativ mai mari decât texturarea, așa că nu este de mirare că numărul de unități de textură a crescut mai modest. De la 64 la 9800 GTX, obținem GTX 280 până la 80 (și comparând 8800 GTX cu GTX 280 de data aceasta, am trecut de la instrucțiunile aritmetice teoretice la raportul texel filtrat de 14,1:1 la 19,4:1) . Ce înseamnă asta în practică?

Pentru a evalua performanța aritmetică, puteți folosi teste sintetice cu texturi procedurale (necesită multe calcule). Bineînțeles, Nvidiei îi place 3DMark Vantage și testul său Perlin Noise, unde am măsurat o creștere de 129% a performanței când trecem de la 9800 GTX la GTX 280. Dar având în vedere importanța pe care Nvidia o acordă acestui test și ușurința cu care noile drivere poate fi optimizat pentru el (apropo, diferit pentru GTX 280 și 9800 GTX), astfel încât testul să facă ceea ce vrea producătorul de la el (vezi pe acest subiect), să analizăm rezultatele versiunii uitate de RightMark 3D cu Pixel Shader 2.0 (Direct3D 9.0). Deoarece rezultatele diferitelor teste diferă semnificativ în valori absolute, am exprimat rezultatele ca procente și am folosit 9800 GTX ca bază.

După cum puteți vedea, îmbunătățirile sunt mult mai modeste, deși sunt prezente - mai puțin pentru shaders procedurali și mai mult pentru efecte de iluminare complexe, unde vedem o creștere de până la 78%. Acum să trecem la versiunea 2 a pachetului RightMark și shaders-urile sale 4.0 (Direct3D 10.0).

Creșterea este vizibilă aici, dar este mai aproape de creșterea raportului de mai sus dintre aritmetica în virgulă mobilă și filtrarea texel decât de numerele pe care le oferă 3DMark Vantage.

ROP

O surpriză plăcută ne aștepta cu unități de operare raster (ROP) - numărul acestora a crescut de la 24 în G80 (16 în G92) la 32. Pentru a le asigura încărcarea, nVidia a folosit o magistrală de 512 biți, care, având în vedere caracteristicile GPU, va fi în mod clar mai util aici decât pe R600.

Vedem o creștere de 78% a performanței pentru GTX 280 față de 9800 GTX, care este aproape de valorile teoretice, deoarece creșterea ROP a fost însoțită de o scădere a frecvenței (675 MHz pentru 9800 GTX).

Și de când am început să vorbim despre AMD, trebuie menționat că această companie trebuie să își revizuiască rapid GPU-urile high-end, care au fost limitate la 16 unități de textură și 16 ROP-uri de la anunțul X800 în 2004! Dacă GPU-urile AMD rămân competitive din punct de vedere al puterii de procesare, din alt punct de vedere sunt serios depășite de Nvidia, care aduce îmbunătățiri cu fiecare nouă generație. Să sperăm că noua arhitectură AMD, care va fi introdusă foarte curând, va reduce acest decalaj.

Apropo, rezultatele HD 3870 X2 arată că, deși ATI este inferior în ceea ce privește numărul de blocuri pe cip, nu uitați că noua strategie a producătorului este să folosească carduri cu două GPU-uri împotriva cardurilor cu un singur GPU de la nVidia. ! Din acest motiv, dar și din cauza frecvenței puțin mai mari (825 MHz), 3870 X2 conduce în acest test, care este sintetic, dar relevant.

Ce zici de Direct3D 10.1?

După campania nVidia de ceva vreme despre inutilitatea sa, cu greu suntem surprinși de lipsa suportului pentru noul API al Microsoft în 200 GTX. Acest lucru nu ne-a surprins, dar ne-a supărat. Potrivit nVidia, suportul API a fost inițial planificat, dar dezvoltatorii intervievați erau încrezători că „nu este important”. Desigur, Direct3D 10.1 nu adaugă nimic revoluționar - așa cum am observat în revizuire a cardurilor Radeon HD 38x0, totuși, corectează deficiențele prezente în specificațiile Direct3D 10 Și există câteva caracteristici noi interesante care pot fi utile pentru motoarele de randare, precum umbrirea amânată, care devine din ce în ce mai populară, precum și algoritmi pentru redarea suprafețelor transparente fără sortare.

Da, acest lucru poate părea oarecum redundant în această situație, când Direct3D 10 nu și-a arătat încă superioritatea în versiunea a noua, dar explicațiile nVidia par vagi. Ideea că Direct3D 10.1 este inutil în acest moment nu poate fi numită falsă (deși Assassin's Creed demonstrează contrariul), totuși, ne aflăm într-un cerc vicios - fără sprijin din partea nVidia, este destul de evident că dezvoltatorii nu vor lua ATI în serios. Am mai văzut o situație similară, dar a fost invers: care dezvoltatori au folosit Shader Model 3 când a apărut NV40, mai ales pe primul GeForce 6, unde funcții de bază precum Vertex Texture Fetch și ramificarea dinamică în shadere au fost implementate prost. Dar, desigur, la acea vreme Nvidia se considera avangarda API-ului 3D.

Prin urmare, opinia noastră nu s-a schimbat față de articolul precedent. Chiar dacă DirectX 10.1 nu poate fi folosit acum, ne place când noile procesoare 3D vin cu cele mai noi tehnologii cu care dezvoltatorii se pot familiariza. Am criticat ATI atunci, iar acum nVidia a primit criticile noastre.

Arhitectura in detaliu

Arhitectura SIMT?

Probabil că sunteți familiarizat cu termenii SIMD (instrucțiune unică, multe date) și MIMD (multe instrucțiuni, multe date), dar în GT200, Nvidia descrie multiprocesoarele shader drept „unități SIMT”. Ce sunt ele mai exact? Abrevierea înseamnă Single Instruction Multiple Threads (o instrucțiune, multe fire), iar principala diferență față de modul SIMD este că vectorii procesați nu au o lățime clar definită. Cu un număr suficient de fire, procesorul funcționează ca un procesor scalar. Pentru a înțelege, să ne amintim cum funcționau unitățile pixel shader în arhitecturile anterioare.

Rasterizatorul generează quad-uri - 2x2 pătrate de pixeli, unde fiecare pixel este specificat de un vector de patru valori în virgulă mobilă cu precizie unică (R, G, B, A) sau (X, Y, Z, W) - cel mai des folosit format în calculul 3D. Quad-urile merg apoi la procesoarele de flux (ALU), care funcționează în modul SIMD cu 16 canale, ceea ce înseamnă că aceeași instrucțiune este aplicată tuturor celor 16 numere în virgulă mobilă. Desigur, am simplificat oarecum totul, dar principiul poate fi înțeles; de fapt, GeForce 6 și 7 au un mod de co-emitere pentru a executa două instrucțiuni pe vector.

După G80, acest mod de operare a fost schimbat - rasterizorul a generat încă quad-uri, care au fost scrise în buffer. Când 8 quad-uri (32 de pixeli, „warp” în terminologia CUDA) s-au acumulat în buffer, acestea ar putea fi executate de multiprocesor în modul SIMD. Care este diferența? Modul în care datele sunt acum organizate: în loc să lucrăm pe patru vectori a patru operații în virgulă mobilă, care ar putea arăta ca (R, G, B, A, R, G, B, A, R, G, B, A , R, G, B, A), multiprocesorul operează pe vectori a 32 de numere în virgulă mobilă, fiecare reprezentând aceeași componentă a 32 de fire: de exemplu, (R, R, R, R, R, R, R, R, R, R , R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R), apoi (G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G , G, G, G, G, G, G, G) etc.

În programarea SIMD, prima aliniere a datelor se numește AoS (Array Of Structures), iar a doua se numește SoA (Structure of Arrays). A doua organizație oferă o productivitate mai mare. Dacă există date suficiente pentru a umple vectorul, procesorul, din punctul de vedere al programatorului, arată ca un bloc scalar, deoarece blocurile SIMD sunt întotdeauna folosite 100% indiferent de lățimea datelor care sunt procesate. Prin urmare, AoS atinge performanța maximă numai atunci când aceeași instrucțiune este impusă tuturor celor patru componente ale fiecărui vector.

Click pe poza pentru marire.

Fiecare dintre cele opt TPC-uri (Texture Processor Clusters) este echipat cu o unitate de textură și două Streaming Multiprocessors (SM). Pentru GT200, nVidia a crescut numărul de unități TPC la 10, fiecare încă echipată cu o unitate de textură, dar cu trei multiprocesoare.

Click pe poza pentru marire.

Această schimbare reprezintă o schimbare în orientarea shader-urilor moderne, cu accent pe instrucțiunile aritmetice. Unitățile de textură ale fiecărui cluster TPC folosesc același model ca și G84 și G92 - puterea adresei este aceeași cu puterea de filtrare, spre deosebire de G80, unde puterea de filtrare era de două ori mai mare decât puterea adresei. Astfel, în modul simplu de filtrare a texturii RGBA8, unitățile de textură G84/G92/GT200 sunt de două ori mai productive decât G80. Cu moduri de filtrare mai avansate sau texturi RGBA16, modificarea nu afectează rezultatul.

Există o altă îmbunătățire specifică lui GT200: Nvidia spune că acum folosește un sistem de dispecer mai eficient pentru operațiunile de textura, care ar trebui să aducă rezultatul mai aproape de performanța de vârf în comparație cu G92. Să ne uităm la rezultatele Fillrate Tester.

Trecerea de la 64 la 80 de unități de textură, ținând cont de diferența de ceasuri GPU, ar trebui să ofere GTX 280 un avantaj de doar 11% față de 9800 GTX. Dar am măsurat 43% când folosim patru texturi și 118% când folosim două! Este puțin probabil ca o îmbunătățire a sistemului de expediere să explice diferența. Cu toate acestea, și creșterea numărului de POR (dublare) a jucat un rol. În orice caz, este destul de clar că GTX 280 este mult mai aproape de ratele de umplere teoretice cu una sau două texturi (97%) decât 9800 GTX (între 80 și 91%), ceea ce înseamnă că îmbunătățirile Nvidia au dat roade în practică. După cum am explicat mai sus, o placă AMD cu două GPU, care rulează și la viteze de ceas mai mari în comparație cu Nvidia, este cu doar 32% inferioară GTX 280 cu patru texturi.

Acum să ne uităm la rezultatele testului de texturare RightMark3D 2.0 PS 4.0.

Rezultatul primului test de shader (Fur) este surprinzător: o creștere de 14%, ceea ce nu este mult având în vedere optimizarea blending-ului, a shader-urilor geometriei și a ratei de umplere, deși totul depinde de implementarea shader-urilor. Pe de altă parte, o creștere de 59% a testului Maparea paralaxelor abrupte mai impresionant, la egalitate cu așteptările noastre.

Pe lângă creșterea numărului, fiecare multiprocesor a trecut prin mai multe optimizări. Primul este de a crește numărul de fire active per multiprocesor - de la 768 la 1.024 (de la 24 "warps" cu 32 de fire la 32). Un număr mai mare de fire este util în special pentru compensarea latenței în operațiunile de textură. La scara GPU, obținem o creștere a numărului de fire active de la 12.288 la 30.720.

Numărul de registre per multiprocesor s-a dublat, de la 8.192 la 16.384 Odată cu creșterea însoțitoare a numărului de fire de execuție, numărul de registre pe care un thread poate folosi simultan a crescut de la 10 la 16. Pe G8x/G9x, algoritmul nostru de testare a folosit. 67% din unitățile de calcul; pe GT200, acest număr ar trebui să fie de 100%. Luând în considerare două unități de textură, performanța ar trebui să fie semnificativ mai mare decât cea a lui G80, pe care l-am luat și pentru testare. Din păcate, CUDA 2.0 necesită un driver care este încă în versiune beta și nu recunoaște GeForce 200 GTX. Când apare suportul în ramura principală a driverului, vom repeta testul.

Click pe poza pentru marire.

Aceasta nu este singura îmbunătățire pe care nVidia a adus-o cu multiprocesoarele sale: compania a anunțat o optimizare a modului dual-issue. După cum vă amintiți de la G80, multiprocesoarele permit două instrucțiuni pe ciclu de ceas: una MAD și una MUL în virgulă mobilă. Menționăm „presupus” pentru că la momentul respectiv nu am putut verifica acest comportament în testele noastre sintetice - nu știm dacă această limitare s-a datorat suportului hardware sau driverelor. Câteva luni mai târziu, după mai multe versiuni de driver, știm că MUL nu este întotdeauna ușor de separat pe G80, așa că problema este cel mai probabil una hardware.

Dar cum funcționează modul cu două probleme? La vremea lui G80, Nvidia nu a oferit detalii, dar apoi, studiind brevetul, am aflat puțin mai multe despre modul în care sunt executate instrucțiunile pe multiprocesoare. Pentru început, brevetul evidențiază în mod clar că multiprocesoarele pot declanșa doar execuția unei instrucțiuni per ciclu de ceas GPU. Deci, unde este faimosul mod cu două probleme? De fapt, se rezumă la specializarea hardware: o instrucțiune folosește două ceasuri GPU (patru stream procesor/ALU ceasuri), poate fi aplicată la „warp” (executarea a 32 de fire pe blocuri SIMD cu 8 canale), dar începutul conducta multiprocesor poate executa execuția unei singure instrucțiuni la fiecare ciclu de ceas, dacă aparțin unor tipuri diferite: MAD într-un caz, SFU în altul.

Pe lângă operațiile transcendentale și interpolarea valorilor fiecărui vârf, SFU-urile sunt capabile să efectueze multiplicarea în virgulă mobilă. Prin alternarea execuției instrucțiunilor MAD și MUL, puteți obține o „suprapunere” în timpul de execuție a instrucțiunii. Astfel, fiecare ceas GPU produce un rezultat MAD sau MUL în „warp” - adică 32 de valori scalare. Pe baza descrierii nVidia, vă puteți aștepta să deveniți MAD Şi MUL la fiecare două cicluri de ceas GPU. De fapt, rezultatul este același, dar din punct de vedere hardware, începutul conductei este simplificat semnificativ, acceptând furnizarea de instrucțiuni pentru execuție câte una pentru fiecare ciclu de ceas.

Click pe poza pentru marire.

Ce a limitat această caracteristică pe G8x/G9x a fost remediată pe GT200? nVidia, din păcate, nu specifică. Reprezentanții companiei spun pur și simplu că au blocuri îmbunătățite, cum ar fi alocarea registrelor, programarea și instrucțiunile de lansare pentru execuție. Dar am făcut o presupunere apropiată de realitate. Acum să vedem cât de mult au afectat practica nVidia - testul sintetic GPUbench.

Pentru comparație, am inclus rezultatele 9800 GTX. De data aceasta totul este clar: puteți vedea viteza de execuție mai mare a instrucțiunilor MUL în comparație cu instrucțiunile MAD. Dar suntem încă departe de a dubla valorile, aproximativ 32% față de MAD. Dar și asta e bine. Trebuie remarcat faptul că rezultatele pentru instrucțiunile DP3 sau DP4 nu trebuie luate în considerare deoarece numerele nu au fost constante. Același lucru este valabil și pentru instrucțiunile POW, care este probabil o problemă a driverului.

Ultima modificare făcută cu multiprocesoarele de streaming este suportul pentru precizie dublă (virgulă mobilă de 64 de biți în loc de 32 de biți). Pentru a fi sincer, precizia suplimentară este rareori folosită în algoritmii grafici. Dar, după cum știm, GPGPU (folosind GPU-ul pentru calcule) devine din ce în ce mai important pentru nVidia, iar în unele aplicații științifice este necesară o precizie dublă.

Nvidia nu este prima companie care a observat acest lucru. IBM și-a actualizat recent procesoarele Cell pentru a îmbunătăți performanța SPU pe acest tip de date. În ceea ce privește performanța, desigur, implementarea GT200 lasă mult de dorit - calculele cu virgulă mobilă cu precizie dublă sunt implementate pe un bloc separat al multiprocesorului de streaming. Blocul permite un calcul de dublă precizie MAD per ciclu de ceas, oferind o performanță maximă de 1.296 x 10 (TPC) x 3 (SM) x 2 (Multiply+Add) = 77,78 Gflops, sau undeva între 1/8 și 1/12 pe performanță de precizie unică. AMD a adăugat același suport folosind aceleași unități de calcul în câteva cicluri de ceas, ceea ce a dat rezultate semnificativ mai bune - doar de două până la patru ori mai lente decât calculele cu precizie unică.

ROP

După cum am spus deja, numărul de unități de operare raster (ROP) a crescut, dar nu am primit nicio funcție nouă. Cu toate acestea, merită să recunoaștem că ROP-urile lui G8x sunt deja destul de complete, cu suport pentru buffer-uri de cadru în virgulă mobilă pe 16 și 32 de biți cu mixare și anti-aliasing; Anti-aliasing până la 8x sau 16x în modul CSAA; Redarea Z este de opt ori mai rapidă etc. Nu este deloc nevoie să adaugi ceva. Prin urmare, nVidia a început să optimizeze performanța. Pentru amestecarea în memorie tampon de cadre RGBA8, am obținut jumătate din performanță pe G8x/G9x, cu 12 pixeli pe ceas. Cu GT200, această limitare a fost eliminată, iar prin adăugarea unei magistrale de 512 biți, cu un throughput de peste 140 GB/s, noile ROP-uri pot face plăcile GeForce imbatabile în ceea ce privește debitul. Mai jos sunt rezultatele pentru pixel Z-fill.

In ceea ce priveste performanta pura, rezultatele nu dezamagesc, stabilim un nou record: 75.537 megapixeli pe secunda! Cu toate acestea, valoarea poate fi considerată în continuare o dezamăgire în sensul că am primit o creștere de patru ori mai degrabă decât de opt ori a ratei de umplere de bază. Pentru 9800 GTX am obținut o creștere de 5,2 - puțin mai bună, dar din nou sub valoarea teoretică.

Rezultatele Fillrate Tester

Performanța geometry shader pe procesoarele anterioare nVidia Direct3D 10 nu a fost foarte impresionantă din cauza prețurilor greșite și a bufferelor interne prea mici. Amintiți-vă că, conform specificațiilor Direct3D 10, shaderul de geometrie este capabil să producă până la 1.024 de valori în virgulă mobilă cu precizie unică per vârf de intrare. Prin urmare, cu o sarcină semnificativă asupra geometriei, tampoanele s-au umplut rapid și au împiedicat calculele ulterioare ale geometriei. GT200 a mărit dimensiunea tamponului de șase ori, ceea ce îmbunătățește semnificativ performanța în unele cazuri, după cum vom vedea. Pentru a profita la maximum de dimensiunea bufferului, Nvidia a trebuit să lucreze la expedierea firelor de umbrire geometrie.

La primul Galaxy shader creșterea este foarte modestă - 4%. Pe de altă parte, pe Hyperlight a fost de 158% - dovadă de îmbunătățiri în lucrul cu tipuri similare de shadere, deși totul depinde de implementare și de putere (numărul de puncte/numerele în virgulă mobilă generate pe vârf de intrare). În general, GTX 280 a redus decalajul și a depășit-o pe 3870 X2 pe același shader.

Acum să aruncăm o privire la rezultatele testului Rightmark 3D Point Sprites (Vertex Shading 2.0).

De ce vorbim despre acest test în secțiunea despre geometry shaders? Pur și simplu pentru că, începând cu Direct3D 10, geometry shaders sunt responsabili pentru procesarea sprite-urilor punctului, ceea ce explică dublarea performanței dintre 9800 GTX și GTX 280!

Îmbunătățiri diverse

Nvidia a optimizat mai multe aspecte ale arhitecturii. Memoria cache post-transformare a fost mărită. Rolul acestui cache este de a evita nevoia de a retransforma un singur vârf de mai multe ori cu primitive indexate sau benzi triunghiulare prin înregistrarea rezultatului shaders-urilor de vârf. Datorită creșterii numărului de ROP, performanța tăierii Early-Z a fost îmbunătățită semnificativ. GT200 este capabil să decupeze până la 32 de pixeli pe mască pe ciclu de ceas înainte de a aplica pixel shader-ul. În plus, nVidia pretinde că optimizează transferul de date și comenzi între driver și începutul conductei GPU.

Deoarece practic dublarea numărului de procesoare de flux (ALU) poate duce la unele îmbunătățiri, să aruncăm mai întâi o privire la modul în care se comportă cardurile în testul Rightmark Vertex Shaders.

În mod surprinzător, în ciuda diferitelor ajustări și a testelor repetate, GTX 280 nu numai că a arătat mai puține performanțe decât 9800 GTX, dar a scăzut și cu 12%! Nvidia a obținut aceleași rezultate și am putut să le schimbăm doar activând anti-aliasing de 4x - un pas surprinzător pentru un test de geometrie. Dar trebuie remarcat faptul că, în ciuda puterii de procesare crescute (și a performanței de transformare crescute), motorul de configurare nu s-a schimbat. Ca și în cazul modelului 9800 GTX, cardul este capabil să genereze doar un triunghi pe ceas. Și avantajul de ceas al lui 9800 GTX (675 MHz față de 600 MHz) explică diferența.

Așa cum este de obicei cazul cu RightMark 2.0, primul test de shader nu a arătat nicio îmbunătățire a noii plăci video, dar al doilea a dat o creștere de 25%.

Am vorbit deja pe larg despre îmbunătățirile aduse dispozitivelor de umbrire avansate de pixeli (în special în secțiunea de teste aritmetice), dar să aruncăm o privire la shadere mai simple, și anume Fillrate Tester, un test de umbrire per pixel pe care l-am folosit. de patru ani acum.

Au trecut destul de mulți ani, așa că ne-am putea aștepta la o creștere a performanței de peste 40% pentru GTX 280. Nu vom afișa toate rezultatele de la ShaderMark (care folosește Pixel Shader 3.0), dar chiar și acolo îmbunătățirea a variat de la 20 la 26% pentru ultimele șase shadere, iar creșterea maximă nu a fost mai mare de 43%.

Toate rezultatele au fost surprinzătoare, arătând decalajul dintre creșterea teoretică a puterii (care ar trebui să afecteze vertex și pixel shaders, chiar și pe cele mai vechi) și câștigul real în aplicații. Desigur, driverele nu sunt încă pe deplin optimizate și nu trebuie să uităm că atunci când rulăm chiar și cel mai specific test, este foarte dificil să izolați orice parte a conductei, astfel încât să nu fie afectată de restul, mai ales în arhitecturile moderne. .

Specificații: chiar mai mari!

După cum se întâmplă adesea, nVidia a pregătit două plăci video pentru anunț: versiunea extrem de high-end a GeForce GTX 280 și placa video GeForce GTX 260 ceva mai accesibilă, dar totuși high-end Să ne uităm la caracteristicile acestor videoclipuri cărți în comparație cu concurenții lor.

Specificațiile principalelor plăci video
GPU	HD 3870 X2	9800 GX2	8800 Ultra	GTX 260	GTX 280
Frecvența GPU	825 MHz	600 MHz	612 MHz	576 MHz	602 MHz
Frecvența ALU	825 MHz	1 500 MHz	1 512 MHz	1 242 MHz	1 296 MHz
Frecvența memoriei	900 MHz	1.000 MHz	1.080 MHz	999 MHz	1 107 MHz
Lățimea magistralei de memorie	2x256 biți	2x256 biți	384 de biți	448 de biți	512 biți
Tipul memoriei	GDDR3	GDDR3	GDDR3	GDDR3	GDDR3
Capacitate de memorie	2 x 512 MB	2x512 MB	768 MB	896 MB	1.024 MB
Numărul de ALU (procesoare de flux)	640	256	128	192	240
Numărul de unități de textură	32	128	32	64	80
numărul POR	32	32	24	28	32
Performanță shader	1 TFlops	(1152) GFlops	(581) GFlops	715 GFlops	933 GFlops
Lățimea de bandă a memoriei	115,2 GB/s	128 GB/s	103,7 GB/s	111,9 GB/s	141,7 GB/s
Numărul de tranzistori	1.334 milioane	1.010 milioane	754 milioane	1.400 de milioane	1.400 de milioane
Proces tehnic	55 nm	65 nm	80 nm	65 nm	65 nm
Zona de cristal	2 x 196 mm²	2 x 324 mm²	484 mm²	576 mm²	576 mm²
Generaţie	2008	2008	2007	2008	2008
Model de shader acceptat	4.1	4.0	4.0	4.0	4.0

Cu 1.400 de milioane de tranzistori și o suprafață a matriței de 576 mm², Nvidia a creat un alt monstru - cel mai mare GPU produs vreodată, care bate recordul deja impresionant al lui G80 (este cu 16% mai mic). În principiu, aria cristalului se modifică puțin de-a lungul generațiilor (deși pentru procesoarele „de masă” scade). Evident, producția lui GT200 este foarte scumpă pentru nVidia, chiar și pe un proces tehnic bine pus la punct, dar nu cel mai sofisticat, ceea ce explică existența unui cip atât de mare.

Un alt punct interesant: prin continuarea utilizării GDDR3, nVidia nu mai este cu una, ci cu două generații în spatele concurentului său, deoarece GDDR5 va apărea în Radeon HD 4870, care va fi lansat în viitorul apropiat. Cu toate acestea, trebuie remarcat faptul că, datorită magistralei de memorie pe 512 biți, creșterea lățimii de bandă este încă de 64% față de 86,4 GB/s pentru 8800 GTX. Am văzut în sfârșit apariția unei plăci video high-end cu mai mult de 512 MB de memorie (fără a lua în calcul 8800 Ultra, relativ vechi și nu cel mai comun)! Cu 1 GB (și 896 MB pentru GTX 260, ceea ce este de asemenea bun), performanța la rezoluția de 2.560 x 1.600 ar trebui să fie foarte decentă.

În cele din urmă, frecvențele s-au dovedit a fi foarte conservatoare, în special pentru procesoarele de flux (ALU), care, printre altele, sunt mai lente decât cele de pe 8800 Ultra.

GTX 280 sau GTX 260?

Cu o performanță în virgulă mobilă cu 30% mai mare și o lățime de bandă a memoriei cu 27% mai mare, decalajul teoretic dintre cele două plăci grafice noi ale Nvidia este destul de vizibil. În practică, plăcile sunt foarte asemănătoare între ele și, de asemenea, cu cele mai recente modele GeForce 9 high-end - o consecință nefericită a carcaselor generice „cutie neagră” pe care Nvidia le folosește pe cele mai recente plăci video. Doar un ventilator radial mare de 8 cm, ușor înclinat pentru a ventila baza, precum și conectori suplimentari de alimentare, care nu mai sunt necesari, sunt expuse în exterior. Pentru alimentare se folosesc doi conectori PCI Express cu șase pini sau unul cu șase și unul cu opt pini: sursa de alimentare va trebui să funcționeze cu această putere dacă doriți să instalați un GeForce GTX 280 sau GTX 260. Dar acest lucru nu este nimic nou. , deoarece ATI ne-a obișnuit cu astfel de cerințe în ultimul an, lansând 2900 XT.

Click pe poza pentru marire.

Conectorii SLI și intrarea audio HDMI, care sunt prezente, sunt ascunse în spatele capacelor detașabile. Singura diferență reală cu GeForce 9800 GTX este că, deși capacul celui de-al doilea slot are un orificiu de evacuare a aerului cald, o parte din aerul de pe card iese prin a doua grilă, urcând, așa că rămâne în interiorul carcasei - nu sunt o veste bună . Cardurile au în continuare 26,7 cm (10,5") lungime - standardul pentru modelele de ultimă generație în ultimii doi ani - și greutatea este doar mai mică de un kilogram la 915 g, ceea ce este puțin mai ușor decât 940 g al HD 3870 X2.

Click pe poza pentru marire.

Pentru testare, am primit plăci video Leadtek, care, în mod tradițional pentru modelele high-end la lansare, folosesc un design de referință, iar producătorul poate fi identificat doar prin câteva autocolante de pe carcasă. Kit-ul GTX 280 include jocul NeverWinter Nights 2 (nu cea mai recentă versiune care ar arăta puterea plăcii video), un adaptor DVI-VGA, un cablu HDTV (YUV și S-Video), două adaptoare de la Molex la șase. conector PCI Express cu pini și un adaptor de la Molex la o mufă PCI Express cu opt pini.

Pentru acest test am folosit configurația de referință și am testat jocuri exclusiv folosind Fraps, în condiții reale. Majoritatea jocurilor care ne-au ajutat în trecut sunt incluse în recenzie, le-am actualizat în mod tradițional (cu cele mai recente patch-uri), dar am adăugat două jocuri noi: Mass Effect, un RPG de saga spațială de la Bioware, care, în ciuda rădăcinile sale pe Xbox 360, a fost portat cu succes. Este un joc fără de care nu ne-am putea lipsi (mai ales că reduce diferența după ce am renunțat la Fable). Al doilea joc este Race Driver: GRID, care, în ciuda interfeței, este un coșmar pentru testeri (similar cu precedentul Colin McRae Dirt de la același editor, Codemasters). Acest joc este foarte atractiv din punct de vedere vizual și folosește cea mai recentă versiune a Ego Engine.

Toate testele sintetice DirectX 9 au fost executate sub Windows XP din cauza instabilității lor sub Vista (Fillrate Tester, RightMark 1050, ShaderMark 2.1 și SPECviewperf 10). RightMark 3D 2.0 (DirectX 10) a fost lansat, destul de înțeles, sub Windows Vista (fără SP1, deoarece testul a fost și instabil cu acesta), iar pentru toate jocurile am folosit Vista SP1, precum și pentru teste CUDA, măsurători de zgomot și temperatură , precum și pentru overclockare. Am dezactivat UAC, Aero, SuperFetch și indexarea pentru a obține rezultate repetabile.

Pentru test am folosit doar două rezoluții: 1.920 x 1.200 (24/26") și, bineînțeles, 2.560 x 1.600, suportate de monitoare de 30" (Samsung 305T în cazul nostru). Motivul este că credem că plăcile grafice high-end ca aceasta vor fi folosite doar pentru aceste rezoluții. Dacă monitorul dvs. are o rezoluție mai mică (până la 22"), atunci probabil că nu ar trebui să cheltuiți bani pe modele similare pentru a obține o imagine netedă și frumoasă, așa cum avem deja.

Testați configurația
Placa de baza	Asus P5E3 Deluxe (Intel X38)
CPU	Intel Core 2 Quad QX6850 (3 GHz)
Memorie	Crucial 2 x 1 GB DDR3 1333 MHz 7-7-7-20
hard disk	Western Digital WD5000AAKS
Unitate optică	Asus 12x DVD
unitate de putere	Cooler Master RealPower Pro 850W
Software
OS	Windows XP, Vista, Vista SP1
drivere nVidia	ForceWare 177.34 beta (GTX 260 și GTX 280 sub Vista) ForceWare 177.26 beta (GTX 280 sub XP) ForceWare 175.16 WHQL (9800 GTX, 9800 GX2, 8800 Ultra)
Drivere AMD	Catalizator 8,5 WHQL (HD 3870 X2)

Click pe poza pentru marire.

De ce să testați cele mai recente plăci grafice de ultimă generație pe un joc despre care se știe că consumă mult CPU? Motivul este simplu: trebuie să vă asigurați că noile plăci video se comportă cel puțin la fel de bine ca generația anterioară și, de asemenea, să verificați dacă driverul este bine dezvoltat. După cum am văzut de multe ori înainte, Flight Simulator X poate ascunde câteva surprize.

După cum puteți vedea, noua GeForce GT200 nu este deloc încurajatoare. Niciunul nu a reușit să producă mai mult de 23 de fps, ceea ce este jenant, chiar dacă este Flight Simulator X. Dar 9800 GX2 și 8800 Ultra s-au apropiat de pragul de 30 de fps, ceea ce este mult mai bun. Suntem siguri că situația ar trebui să se îmbunătățească în următoarea versiune de drivere, deoarece este oarecum paradoxal să cumpărați ultima generație de plăci video nVidia doar pentru a experimenta o scădere a performanței. Chiar și într-un joc în care performanța procesorului joacă un rol important.

Click pe poza pentru marire.

În timp ce GTX 280 a funcționat bine în Call of Duty 4, învingând 9800 GTX cu 41% (1.920 x 1.200) și 91% (2.560 x 1.600 + filtre), 9800 GX2 s-a dovedit a fi un concurent dur. A depășit chiar și 280 la 1.920 x 1.200 (cu 17%), probabil datorită numărului mai mare de unități de textură - singura măsură teoretică prin care cele mai recente plăci dual-GPU ale Nvidia depășesc. La o lățime de bandă a memoriei de 30" și o cantitate dublă de memorie i-au dat GTX 280-ului în frunte, dar numai după ce am activat 4x anti-aliasing (încă se poate reda). Am început să bănuim că am putea obține rezultate foarte aproape unul de celălalt pe aceste plăci video. Rețineți că GTX 260 este cu 21-26% în spatele modelului mai vechi, ceea ce este destul de așteptat având în vedere specificațiile, placa video este net superioară 8800 Ultra, dar este vizibil inferioară 9800 GX2 în acest test.

Click pe poza pentru marire.

În jocul Test Drive Unlimited, nu există nicio îndoială cu privire la superioritatea noilor plăci video high-end nVidia, chiar dacă 9800 GX2 a fost foarte aproape (decalajul este mai mic de 8% în primele trei moduri și 17% în maxim). O altă veste bună pentru producător este că superioritatea lui GTX 280 devine remarcabilă de la rezoluția 1920 x 1200, unde performanța este de două ori mai mare decât a lui GTX 9800 (cu filtrare și anti-aliasing). Cu toate acestea, trecerea la 30" nu a întărit avantajul, ci, dimpotrivă, l-a redus, dar avansul este încă 50% fără filtre și 76% cu ele. În ceea ce privește GTX 260, avansul său față de 8800 Ultra la aceeași rezoluție a scăzut, de asemenea, la 11 % în medie.

Click pe poza pentru marire.

Crysis continuă să obțină o atenție surprinzătoare. Mai jos sunt testele noastre (am testat jocul pe o nouă etapă, care nu este atât de intensivă în GPU ca cea anterioară).

Datorită exigențelor mari ale jocului (de data aceasta l-am testat la aceleași rezoluții ca și alte jocuri), ierarhia din diagramă corespunde rezultatelor fără filtre, deoarece acestea sunt inutile. Puteți juca Crysis la 1920 x 1200 pe noul GTX 280? Da, dar nu la fel de fluid ca 9800 GX2 din scena noastră de testare. Doar activarea anti-aliasing a permis lui 280 să iasă înainte, dar rata de cadre este prea mică pentru a fi redată în modul de detaliu „Foarte ridicat”. Și problema este că, deși în trei din patru teste, GTX 280 a depășit-o pe 9800 GX2 în Crysis, este puțin probabil să fie jucabil. Acest lucru a fost în ciuda performanței mai mult decât duble la 2560 x 1600 și a faptului că noile cărți au fost singurele, altele decât 8800 Ultra, care puteau rula jocul cu anti-aliasing activ. Per total am fost dezamăgiți.

Click pe poza pentru marire.

În fața noastră este un alt joc „greu”, dar, în orice caz, poți juca la o rezoluție de 2.560 x 1.600 fără filtre. Cu toate acestea, placa video din World in Conflict a cedat locul „calului întunecat” la o rezoluție de 1.920 x 1.200: Radeon HD 3870 X2! Încă o dată, după activarea filtrelor, cardul AMD dual-GPU, care este grozav pentru acest joc, a oferit o performanță mai bună, depășind ușor GTX 280. Pe display-ul de 30 inchi, cardul AMD și-a păstrat avantajul, iar capacitatea de memorie a lui GTX 280 din nou a funcționat bine pe ultimul mod, deși cu greu poți juca confortabil pe el și asta nu este tot: la aceeași rezoluție, cardul nVidia a ieșit pe primul loc, dar 9800 GX2, nu și GT200 în Conflict and Crysis, apoi GTX 280. Este puțin probabil să ai nevoie de el...

Click pe poza pentru marire.

De-a lungul timpului, acest joc a devenit mai puțin vorace, mai ales în comparație cu unele jocuri recente. Cu toate acestea, Supreme Commander este încă relevant, mai ales pentru jocurile online. Pe câmpul de luptă, dar cu nu prea multe unități (pentru ca performanța să nu fie limitată de procesor), GTX 280 nu a reușit niciodată să învingă 9800 GX2, care conduce cu 39% la 2560 x 1600. Da, GTX 280 rezultă că Ei nu sunt deloc groaznice, deoarece sunt cu 45% mai rapide decât 9800 GTX și 8800 Ultra, deși ne așteptam la mai mult.

Click pe poza pentru marire.

Două produse noi sunt interesante de analizat în Unreal Tournament 3. Dacă rezultatele la 1.920 x 1.200 nu sunt surprinzătoare, atunci la 2.560 x 1.600 „dark horse” 9800 GX2 a preluat din nou conducerea. Din păcate, memoria limitată de pe această placă grafică ne-a împiedicat să o testăm cu filtre, deși GTX 280 a fost la înălțime și a oferit un joc fără probleme. Diferența medie față de placa video 9800 GTX din generația anterioară a fost de 59%. GTX 260 a funcționat bine, oferind aproximativ 83% din performanța lui GTX 280 la trei din cele patru rezoluții, oferind acestei plăci un raport bun preț/performanță, așa cum vom vedea mai jos.

Click pe poza pentru marire.

Fiind portat de pe Xbox 360, Mass Effect rulează foarte bine pe Radeon HD 3870 X2, cu excepția faptului că se luptă cu anti-aliasing. Cu toate acestea, este destul de bun la 1.920 x 1.200 și 2.560 x 1.600 Dar acest lucru nu a împiedicat GTX 280 să preia conducerea, deoarece 9800 GX2 nu funcționează foarte bine în acest joc, fiind vizibil inferior (34% pe 1920 x. 1200 + filtre și 62% la 2560 x 1600). Diferența dintre GTX 280 și 9800 GTX a fost de 220% la o rezoluție de 1.920 x 1.200 + filtre, iar GeForce GTX 260 este puțin în urma modelului „mai vechi”.

Click pe poza pentru marire.

Jocul este prea nou pentru a avea un profil SLI (este necesar pentru cardurile dual-GPU, cum ar fi 9800 GX2), deci 9800 GX2 este un underdog. Acest lucru ajută doar GTX 280 să iasă înainte. Performanța plăcii grafice este foarte bună: dacă îl bate pe GTX 260 cu doar aproximativ 20%, avansul față de 9800 GTX crește la 50% (cu excepția filtrelor 1920 x 1200 și 2560 x 1600 +). Mai important, cele două noi plăci grafice sunt singurele care permit jocul la rezoluție 2.560 x 1.600 + anti-aliasing 4X, un mod care este foarte plăcut ochilor.

BadaBOOM Media Converter, Folding@Home

BadaBOOM Media Converter este un program de transcodare video dezvoltat de Elemental Technologies care convertește DVD-ul video (numai MPEG2) în format H.264 pentru majoritatea playerelor media portabile, inclusiv iPhone, iPod și PSP (doar cu profiluri prestabilite). Programul este optimizat pentru CUDA (prin platforma video RapiHD de la ETI), astfel încât vă permite să comparați în mod convenabil puterea GeForce compatibilă (toate modelele GeForce 8 și 9) care accelerează această sarcină solicitantă - cândva anunțată de AMD prin AVIVO. Cu toate acestea, encoderul Elemental nu este la fel de greșit și oferă o viteză de compresie mai mare.

Click pe poza pentru marire.

Pe versiunea anterioară, care era compatibilă doar cu GT 200, am putut comprima un videoclip de testare (400 MB) în format iPhone (640 x 365) la calitate maximă în 56,5 secunde pe GTX 260 și 49 de secunde pe GTX 280 (reducere de 15%). În scopuri de comparație, codificatorul iTunes H.264 rulează timp de opt minute folosind resurse CPU (consumând mai multă putere în general, dar semnificativ mai puțin în vârfuri). Totuși, trebuie amintit că acesta este departe de cel mai optimizat compresor H.264, iar BadaBOOM îi lipsește clar flexibilitatea în funcționare, chiar dacă rezultatul este foarte bun.

Folding@Home

Am avut ocazia să testăm clientul pre-beta Folding@Home pe CUDA, a cărui versiune finală ar trebui să apară în zilele următoare. Din păcate, funcționează doar pe GeForce 200.

Click pe poza pentru marire.

Din nou, nVidia are mai mult de un an de latență față de ATI, ale cărui plăci grafice Radeon sunt în proiect, dar GeForce 200 (din moment ce nu am putut testa alte plăci grafice nVidia) oferă performanțe mai bune. În configurația noastră de testare, am obținut 560 ns pe zi pe GTX 280 și 480 ns pe zi pe GTX 260. Spre comparație, PS3 oferă performanțe de aproximativ 150-200 ns pe zi, comparativ cu mai puțin de 10 pentru procesor și 200 pentru un Radeon HD 3870 simplu.

Cu toate acestea, este important să înțelegeți că performanța poate varia cu ușurință în funcție de client pe o arhitectură dată (optimizarea codului este departe de a fi completă pentru clienții ATI și nVidia). Mike H crede că același HD 3870 poate da 300 ns pe zi, dar nu mai puțin de 250. O altă problemă este că la schimbarea proteinei necesare clientului GeForce, se schimbă și performanța. În general, pentru astăzi am dori să subliniem caracterul aleatoriu și caracterul temporar al rezultatelor de mai sus. Suntem încrezători că cu un client care acceptă plăci grafice GeForce compatibile CUDA (totul de la GeForce 8, inclusiv modele entry-level), vor exista oportunități interesante pentru proiect, cu o bază instalată de aproximativ 7.000 TFlops.

Click pe poza pentru marire.

1.400 de milioane de tranzistori pe o tehnologie de proces de 65 nm duc la așteptarea unui consum mare de energie al plăcii video. Să ne uităm la consumul de energie al sistemului, inclusiv pierderile de alimentare (consumul de energie al întregului sistem și pierderile de 20% în sursa de alimentare).

Primul lucru de remarcat: în jocuri, consumul de energie al plăcilor video noi este foarte mare, dar nu bate recorduri. GTX 280 afișează un consum de energie comparabil cu 8800 Ultra, dar inferior celui 9800 GX2. Iar faptul că placa grafică 3870 X2 consumă mai puțină energie se datorează încărcării insuficiente în jocul testat. În același Fillrate Tester, am observat vârfuri mai mari de consum de energie: 404 W pentru 3870X2 față de doar 340 W pentru GTX 280 și 279 W pentru GTX 9800. Consumul de energie al lui GTX 260 este doar puțin mai mare decât al lui 9800 GTX, ceea ce este o veste bună. În ceea ce privește consumul maxim de energie al plăcilor în sine, nVidia specifică 236 W pentru GTX 280 și 182 W pentru GTX 260.

Pe de altă parte, inginerii nVidia au făcut o treabă bună în ceea ce privește consumul de energie în modul inactiv. Plăcile video au un cip care măsoară în mod constant procentul de utilizare a GPU-ului, iar în conformitate cu aceste informații, driverul reglează automat frecvențele, tensiunea și activitatea fiecărei secțiuni a cipului. De recunoscut că rezultatele lui GT 200 sunt cu adevărat impresionante, eliminând decalajul istoric dintre cipurile nVidia și GPU-urile AMD și chiar depășindu-le pe acestea din urmă în ceea ce privește consumul minim de energie. GTX 260 primește o scădere de 20 W a sursei de intrare în comparație cu 9800 GTX, iar GTX 280 consumă mult mai puțină energie - aproximativ 25 W în 2D (ceasurile scade la 300 MHz pentru GPU și 100 MHz pentru memorie) și aproximativ 35 W în timpul Redare disc Blu-ray. Rezultatul este cu adevărat uimitor și mai mult sau mai puțin anulează beneficiul tehnologiei HybridPower, care necesită schimbarea plăcii de bază pentru a dezactiva complet placa 3D externă, pierzând astfel performanța de joc 3D!

Având un consum redus de energie la inactiv și un consum mare, dar nu excesiv, de energie sub sarcină, eram încrezători că GT200 de la Nvidia se va ridica la înălțimea reputației de plăci grafice high-end relativ silențioase de la GeForce 7800 GTX. Ne-am înșelat.

După pornirea Windowsului, ventilatorul GT200 era silențios (516 rpm sau 30% din viteza maximă). Apoi, după ce a pornit jocul, a transformat computerul într-un aspirator, ajungând la un nivel de zgomot care cu greu poate fi numit tolerabil – mai ales cu GTX 280. GTX 260 a funcționat puțin mai bine, dar era și foarte zgomotos la 1.250 rpm (și fluxul de aer era zgomotos, nu ventilatorul în sine). Cu toate acestea, valorile noastre de zgomot inactiv au fost măsurate după finalizarea tuturor testelor, după doar câteva minute de inactivitate. Problema este că GTX 280 nu scade niciodată la minim, iar ventilatorul lui GTX 260, care este mai puțin zgomotos, se învârte în continuare la 700 rpm - relativ tare.

Rezultatele sunt greu de înțeles având în vedere consumul redus de energie al GT200 în modul idle, ele s-ar putea datora unui bug în BIOS (deși a apărut pe ambele plăci video la momentul respectiv) sau în drivere, ceea ce lasă speranță pentru un repara. Pe de altă parte, ventilatorul poate fi întotdeauna observat manual folosind un software special dacă monitorizați temperatura (vezi pagina următoare). În general, am fost foarte dezamăgiți de fanii acestor plăci video, mai ales având în vedere că o parte din aerul cald se întoarce înapoi în carcasă și încălzește alte componente, inclusiv GPU-ul în sine.

În cele din urmă, am observat că, similar testelor de consum de energie, rezultatele la 3870 X2 la sarcină sunt prea bune. Există un motiv pentru asta: Test Drive Unlimited este unul dintre puținele jocuri în care această placă video rulează doar un singur GPU, ceea ce reduce încălzirea.

Acum să ne uităm la temperatura GPU pe care am înregistrat-o (pentru Radeon HD 3870 X2 este pentru GPU-ul activ, a doua temperatură nu depășește niciodată 56°C sub sarcină).

Deloc surprinzător, 260 GTX și 280 GTX se răcesc foarte bine - am avut cele mai scăzute temperaturi când sunt inactiv și unele dintre cele mai scăzute sub sarcină. Nu este surprinzător, deoarece aceste plăci video nu consumă cel mai mare nivel de energie și, așa cum am menționat deja, folosesc un sistem de răcire agresiv. Nu am atins niciodată nivelul de 105°C, unde frecvențele sunt reduse automat pentru a proteja placa grafică. Adică, așa cum ne așteptam, nVidia are o marjă bună pentru reducerea nivelului de zgomot al plăcii video atât în modul inactiv, cât și sub sarcină.

Overclockare

În testele de overclock, am reușit să overclockăm GeForce GTX 260 de la 576/1242/999 MHz (GPU/ALU/memorie) la 648/1397/1184 MHz, adică cu 12%, respectiv 18%. Rezultatul nu este rău, ne-a permis să stoarcem încă 16% sau 8,4 cadre pe secundă în testele de 2.560 x 1.600 din Test Drive Unlimited - doar cu 6% mai lent decât GTX 280!

Este destul de clar că am overclockat și GTX 280: de la frecvențele 602/1296/1107 MHz la 655/1410/1290 păstrând în același timp o stabilitate foarte bună, cu o creștere de 9% și 16%. Test Drive Unlimited a beneficiat din nou de boost, crescând ratele de cadre cu 13% - destul de bine comparativ cu 16% pe care le-am primit de la 9800 GTX. În general, rezultatele sunt plăcute, mai ales la overclocking, care uneori este determinat mai mult de noroc.

Concluzie

Care va fi concluzia noastră cu privire la noile plăci video? Să începem cu faptul că paralela cu GeForce 7800 GTX este prea evidentă. Cardurile sunt construite pe o arhitectură deja dovedită, cu punctele slabe pe care inginerii nVidia le-au descoperit remediate și cu o creștere semnificativă a puterii de calcul. Așa că nu am găsit surprize urâte cu arhitectura, cu posibila excepție a lipsei suportului Direct3D 10.1 sau a performanței ușor dezamăgitoare cu dublă precizie în virgulă mobilă.

Pe de altă parte, spre deosebire de situația actuală, la vremea lui 7800 GTX, nVidia nu avea o placă video dual-GPU atât de puternică precum 9800 GX2. Acest lucru poate fi considerat un dezavantaj în timpul anunțării noilor produse. GTX 280 aproape și-a dublat performanța teoretică pură față de generația anterioară (și chiar performanța practică datorită îmbunătățirilor de eficiență, deși unele dintre testele noastre sintetice nu au arătat atât de multă îmbunătățire a vitezei pe cât am sperat). Dar GTX 280 nu funcționează la fel de bine în comparație cu 9800 GX2, care de multe ori depășește noua placă în benchmark-urile pentru jocuri. Desigur, nu are sens să recomand cardul din generația anterioară, care are jumătate din memorie utilizabilă și un consum mult mai mare de energie în modul inactiv (în afară de alte neajunsuri), rezultatele sale de referință i-au luat totuși o parte din gloria noului nivel extrem de ridicat. -capătul plăcilor video. Este greu să dai vina pe nVidia pentru asta, deoarece este dificil să crești numărul de procesoare de flux (ALU) pe un nucleu deja gigantic. Da, și comparați cu performanța unui concurent.

Mai sunt câteva dezamăgiri. Iar cel mai important dintre ele este nivelul foarte ridicat de zgomot, care este greu de explicat pentru GTX 280 și 260, deoarece consumul lor de energie este mai mic decât cel al plăcilor video cu două GPU-uri sub încărcare și foarte neglijabil în modul inactiv. Nu uitați de lipsa suportului pentru DirectX 10.1, care poate fi numită o alegere clar politică care va încetini sau chiar va împiedica răspândirea acestui standard în rândul dezvoltatorilor, iar acest lucru este oarecum ofensator în lumina jocului Assassin's Creed prețul GTX 280 (650 USD pe piața mondială) , datorită căruia cardul este poziționat la cel mai extrem high-end, este, de asemenea, foarte problematic în lumina prețului foarte agresiv pentru „mai tânărul” GTX 260 - și Performanța acestuia din urmă este cu doar 18% inferioară modelului „mai vechi” Prețul pentru GTX este de aproape 400 de dolari - ca urmare, la începutul vânzărilor (26 iunie). va deveni o soluție foarte atractivă, mai ales că folosește același GPU GT200.

În cele din urmă, nu putem să nu menționăm perspectivele foarte interesante pentru aplicațiile CUDA. Deși în ultimul an și jumătate aproape nimeni nu a menționat CUDA ca o caracteristică pozitivă a GeForce 8, dar astăzi situația s-a schimbat, primele trei aplicații interesante sunt deja gata sau aproape gata. Vorbim despre codificatorul video BadaBOOM și clientul beta Folding@Home GeForce, care lasă mult în urmă CPU-urile și Radeon-urile concurente, precum și suportul GeForce PhysX, care ar beneficia foarte mult dezvoltatorilor. Ei ar putea anunța suport pentru tehnologie în jocurile viitoare, deși încă nu vedem cât de mult va face implementarea în practică. Toate acestea măresc în mod semnificativ domeniul de aplicare al GPU-urilor GeForce compatibile cu CUDA (începând cu GeForce 8), dacă lansarea software-ului optimizat pentru diferite calcule continuă și dacă AMD nu încearcă să „tragă pătura peste sine”.

nVidia GeForce GTX 280

Concluzia pentru GTX 280 va fi următoarea. Noul GTX 280 extrem de înaltă de la Nvidia (650 USD) este un ușor defavorizat în comparație cu 9800 GX2, care depășește în mod regulat standardele de referință pentru jocuri, în ciuda deficiențelor plăcilor dual-GPU. Dar, în realitate, adevărata amenințare este GTX 260 low-end, mai ales având în vedere că la prețul unui GTX 280 aproape că poți cumpăra două GTX 260-uri în SLI!

Avantaje.

performanță generală ridicată;

Defecte.

Fără suport pentru DirectX 10.1;
performanță slabă în comparație cu 9800 GX2;
nivel ridicat de zgomot;
preț ridicat al GTX 280 în comparație cu concurenții nVidia.

nVidia GeForce GTX 260

Cardul este mult mai atractiv datorită unui preț foarte rezonabil. GTX 260 funcționează bine la testele de jocuri și are cele mai multe dintre beneficiile GTX 280 fără prețul ridicat. Cardul va fi pus în vânzare săptămâna viitoare pe piața globală pentru 400 USD.

Suntem nevoiți să subliniem că reprezentanța nVidia din Rusia funcționează nesatisfăcător: încă nu am primit informații despre prețuri sau disponibilitatea cardurilor în țara noastră. Să sperăm că în Rusia nu își vor ridica prețurile.

Avantaje.

Arhitectură GeForce 8 îmbunătățită;
performanța este cu doar 18% mai mică decât GTX 280;
consum foarte mic de energie în modul inactiv;
accelerarea programelor compatibile cu CUDA.

Defecte.

Fără suport pentru DirectX 10.1;
nivel ridicat de zgomot.

Articolul de astăzi va vorbi despre cel mai modern și mai puternic cip grafic din lume de la NVIDIA, cu nume de cod GT200, și despre adaptorul video bazat pe acesta, GeForce GTX 280. Vom încerca să luăm în considerare toate caracteristicile, inovațiile și diferențele sale cele mai interesante față de cipurile anterioare. , precum și testarea performanței în condiții egale și compararea cu concurenții.

Fundal

Dar nu toate odată, să ne întoarcem puțin în timp și să urmărim istoria dezvoltării cipurilor grafice. Nu este un secret pentru nimeni că de mulți ani încoace două companii concurează pe piața plăcilor grafice: ATI (cumpărată în prezent de AMD și având marca AMD Radeon) și NVIDIA. Desigur, există și producători mici, precum VIA cu cipurile sale S3 Chrome sau Intel cu adaptoare video integrate, dar confruntarea dintre ATI (AMD) și NVIDIA a dictat mereu moda. Și ceea ce este demn de remarcat este că cu cât această confruntare a fost mai puternică, sau să nu ne temem nici măcar de acest cuvânt „Război Rece”, cu atât progresul științific și tehnologic a avansat mai mult și beneficiile primite de utilizatorii finali - adică tu și cu mine sunt mai mari. . La urma urmei, unul dintre mecanismele luptei pentru portofelele utilizatorilor este superioritatea tehnică a produselor unuia dintre producători, iar un altul este politica de prețuri și raportul preț/funcție. Apropo, adesea al doilea mecanism se dovedește a fi mult mai eficient decât primul.

Când o parte este vizibil superioară unui concurent în termeni tehnici, cealaltă nu are de ales decât să propună o tehnologie și mai avansată sau să se „joace cu prețurile” la produsele existente. Un exemplu clar al „jocului de preț” este concurența dintre Intel și AMD în domeniul procesoarelor centrale. După anunțul arhitecturii Core 2, AMD nu a putut oferi ceva mai avansat și de aceea, pentru a nu pierde cota de piață, a fost nevoită să reducă prețurile procesoarelor sale.

Dar există și exemple de altă natură. La un moment dat, ATI a lansat o linie de produse de mare succes din familia X1000, care a apărut la momentul potrivit și a fost foarte populară la mulți utilizatori, iar mulți au încă plăci video precum Radeon X1950. NVIDIA nu avea la dispoziție un răspuns demn la acel moment, iar ATI a reușit pur și simplu să o elimine pe NVIDIA din joc timp de aproximativ jumătate de an. Dar trebuie să aducem un omagiu inginerilor din California, după un timp scurt, au venit cu o soluție tehnologică fundamental nouă - cipul G80 folosind procesoare universale. Acest cip a devenit un adevărat flagship pentru o lungă perioadă de timp, a returnat palma companiei californiane și a adus performanțe de joc de neegalat utilizatorilor obișnuiți. Ce sa întâmplat mai departe? Și apoi nu sa întâmplat nimic - ATI (acum sub marca AMD) nu a putut crea ceva mai puternic. Cipul său R600 a eșuat în multe feluri, forțând compania canadiană să reducă constant prețurile. Lipsa concurenței în categoria soluțiilor de productivitate a permis NVIDIA să se relaxeze - până la urmă oricum nu există adversari.

Lansarea unui nou flagship

Toți cei interesați de grafica 3D așteaptă de multă vreme o actualizare reală a arhitecturii G80. Au existat întotdeauna o varietate de zvonuri despre următoarea generație de cipuri, unele dintre ele au fost confirmate ulterior, dar în 2007 am așteptat doar o actualizare arhitecturală minoră sub formă de soluții bazate pe cipuri G92. Toate plăcile video lansate pe baza lor sunt destul de bune pentru sectoarele lor de piață, aceste cipuri au făcut posibilă reducerea costului soluțiilor puternice, făcându-le mai puțin solicitante în ceea ce privește puterea și răcirea, dar pasionații așteptau o actualizare completă. Între timp, AMD a lansat produse actualizate bazate pe RV670, ceea ce i-a adus un oarecare succes.

Dar dezvoltarea industriei jocurilor de noroc, noi jocuri puternice precum Crysis, au forțat ambele companii să dezvolte noi cipuri grafice. Doar obiectivele lor erau diferite: obiectivul principal al AMD a fost să lupte pentru pierderea cotei de piață, să minimizeze costurile de producție și să ofere soluții productive la prețuri rezonabile, în timp ce NVIDIA avea scopul de a menține liderul tehnologic și de a demonstra performanța fantastică a cipurilor sale.

Astăzi vom avea ocazia să examinăm în detaliu rezultatele muncii uneia dintre companii - cel mai productiv și mai modern cip GT200 produs de NVIDIA, prezentat de companie la 17 iunie 2008.

Detalii tehnice

Din punct de vedere arhitectural, GT200 are multe asemănări cu G8x/G9x, noul cip a luat tot ce este mai bun de la ei și a fost completat cu numeroase îmbunătățiri. Și acum trecem la luarea în considerare a caracteristicilor noilor soluții.

Accelerator grafic GeForce GTX 280

nume de cod cip GT200;
tehnologie 65 nm;
1,4 miliarde (!) tranzistori;
arhitectură unificată cu o serie de procesoare comune pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date;
suport hardware pentru DirectX 10.0, inclusiv modelul shader – Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux);
magistrală de memorie pe 512 biți, opt controlere independente de 64 de biți;
frecvența de bază 602 MHz (GeForce GTX 280);
ALU-urile funcționează la mai mult decât dublul frecvenței de 1,296 GHz (GeForce GTX 280);
240 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, acceptă FP-uri de precizie pe 32 de biți și 64 de biți în cadrul standardului IEEE 754(R), efectuează două operații MAD+MUL per ceas);
80 de unități de adresare și filtrare a texturii (ca în G84/G86 și G92) cu suport pentru componentele FP16 și FP32 în texturi;
posibilitatea de ramuri dinamice în pixeli și vertex shaders;
8 blocuri ROP largi (32 de pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanța de vârf a întregului subsistem este de până la 128 de mostre MSAA (+ 128 Z) pe ciclu de ceas, în modul fără culoare (numai Z) – 256 de mostre pe ciclu;
înregistrarea rezultatelor de la până la 8 cadre tampon simultan (MRT);
toate interfețele (două RAMDAC, Dual DVI, HDMI, DisplayPort, HDTV) sunt integrate pe un cip separat.

Consultați specificațiile plăcii graficeNVIDIA GeForce GTX 280

frecvența centrală 602 MHz;
frecventa procesorului universal 1296 MHz;
număr de procesoare universale 240;
număr de blocuri de textură – 80, blocuri de amestecare – 32;
frecvența efectivă a memoriei 2,2 GHz (2*1100 MHz);
tip de memorie GDDR3;
capacitate memorie 1024 MB;
lățime de bandă memorie 141,7 GB/s;
rata de umplere maximă teoretică 19,3 gigapixeli/s;
viteza teoretică de eșantionare a texturii de până la 48,2 gigatexeli/s;
doi conectori DVI-I Dual Link, sunt acceptate rezoluții de ieșire de până la 2560x1600;
conector SLI dual;
Bus PCI Express 2.0;
Ieșire TV, Ieșire HDTV, DisplayPort (opțional);
consum de energie până la 236 W;
design cu două fante;
prețul original sugerat 649 USD.

Separat, observăm că DirectX 10.1 nu este acceptat de familia GeForce GTX 200. Motivul invocat a fost faptul că la dezvoltarea noii familii de cipuri, după consultarea partenerilor, s-a decis să se concentreze nu pe suportarea DirectX 10.1, care este încă puțin solicitat, ci pe îmbunătățirea arhitecturii și performanței cipurilor.

Arhitectura GeForce GTX 280 a suferit multe modificări în comparație cu plăcile video GeForce 8800 GTX și Ultra:

Numărul de nuclee de calcul a fost crescut de 1,88 ori (de la 128 la 240).
Numărul de fire executate simultan a fost mărit de 2,5 ori.
Lungimea maximă a codului de shader complex a fost dublată.
Precizia calculelor cu virgulă mobilă a fost dublată.
Calculele geometrice sunt efectuate mult mai rapid.
Capacitatea memoriei este crescută la 1 GB, iar magistrala este mărită de la 384 la 512 biți.
Viteza de acces la buffer de memorie crescută.
Conexiuni interne îmbunătățite de cip între diferite blocuri.
Optimizări și compresie Z-cull îmbunătățite pentru a asigura o performanță mai mică la rezoluții înalte.
Acceptă o adâncime de culoare de 10 biți.

Iată diagrama principală a cipului GT200:

Caracteristicile arhitecturale cheie ale CUDA

De la anunțarea arhitecturii Core 2 și a marșului său triumfal, în rândul dezvoltatorilor a apărut o modă de a face publicitate, pe lângă numele produselor, și denumirile arhitecturii pe care sunt realizate. NVIDIA nu face excepție, promovând în mod activ arhitectura sa CUDA (Compute Unified Device Architecture) - o arhitectură de calcul menită să rezolve probleme complexe din sfera de consum, afaceri și tehnică - în orice aplicații care folosesc intens date folosind GPU-uri NVIDIA. Avantajul acestei abordări este superioritatea semnificativă, cu un ordin de mărime sau chiar două, a cipurilor grafice față de procesoarele centrale moderne. Dar, imediat, apare un dezavantaj - pentru aceasta este necesar să se dezvolte un software special. Apropo, NVIDIA organizează o competiție între dezvoltatorii de software pentru arhitectura CUDA.

Cipul video GT200 a fost dezvoltat în vederea utilizării sale active în sarcini de calcul folosind tehnologia CUDA. În așa-numitul mod de calcul, noul cip video poate fi imaginat ca un multiprocesor programabil cu 240 de nuclee de calcul, memorie încorporată, capacități de scriere și citire aleatoare și un gigabyte de memorie dedicată cu lățime de bandă mare. După cum spune NVIDIA, în acest mod, GeForce GTX 280 transformă un computer obișnuit într-un mic supercomputer care oferă viteze de aproape teraflop, ceea ce este util pentru numeroase sarcini științifice și aplicate.

Un număr destul de mare dintre cele mai solicitante sarcini pot fi transferate de la CPU la GPU folosind CUDA și, în același timp, va fi posibil să obțineți o creștere vizibilă a performanței. Imaginea prezintă exemple de utilizare a CUDA în sarcini reale și oferă cifre care arată multiplicitatea câștigurilor de performanță ale GPU-ului în comparație cu CPU.

După cum puteți vedea, sarcinile sunt foarte diverse: transcodarea datelor video, dinamică moleculară, simulări astrofizice, simulări financiare, procesare de imagini în medicină etc. Mai mult, câștigurile din transferul calculelor pe cipul video s-au dovedit a fi de aproximativ 20-140 de ori. Astfel, noul cip video va ajuta la accelerarea multor algoritmi diferiți dacă aceștia sunt transferați la CUDA.

Una dintre aplicațiile de zi cu zi ale calculelor GPU poate fi considerată transcodarea videoclipurilor dintr-un format în altul, precum și codificarea datelor video în aplicațiile de editare corespunzătoare. Elemental a finalizat sarcina de a muta codificarea pe GPU în aplicația sa RapidHD, obținând următoarele numere:

Cel mai puternic GPU GeForce GTX 280 se descurcă excelent în această sarcină, creșterea vitezei în comparație cu cel mai rapid procesor central este de peste 10 ori. Codificarea unui videoclip de două minute a durat 231 de secunde pe CPU și doar 21 de secunde pe GT200. Este important ca utilizarea unui GPU să facă posibilă realizarea acestei sarcini nu doar în timp real, ci și mai rapid!

Cu toate acestea, calculul intensiv folosind plăci grafice moderne nu este nou, dar odată cu apariția familiei de procesoare grafice GeForce GTX 200, NVIDIA se așteaptă la o creștere semnificativă a interesului pentru tehnologia CUDA.

Din punctul de vedere al tehnologiei CUDA, noul cip grafic GeForce GTX 280 nu este altceva decât un puternic procesor multi-core (sute de nuclee!) pentru calcul paralel.

NVIDIA PhysX

Acesta este poate cel mai interesant aspect al noilor adaptoare video NVIDIA pentru utilizatorii obișnuiți. Deși se aplică nu numai noilor soluții bazate pe GT200, ci și tuturor plăcilor video din familia GeForce 8 și GeForce 9.

În jocurile moderne, interacțiunile fizice bine implementate joacă un rol important, fac jocurile mai interesante. Aproape toate calculele fizice sunt intensive din punct de vedere al performanței, iar algoritmii asociați sunt intensivi din punct de vedere computațional. Până la un anumit moment, aceste calcule se făceau doar pe procesoare centrale, apoi au apărut acceleratoarele fizice de la compania Ageia, care, deși nu sunt utilizate pe scară largă, au reînviat semnificativ activitatea pe această piață. Doar câțiva jucători entuziaști ar putea achiziționa astfel de amplificatoare.

Dar totul s-a schimbat când NVIDIA a cumpărat Ageia și odată cu ea a primit toate informațiile necesare despre PhysX. Și anume informații, deoarece dispozitivele hardware în sine nu o interesau. Trebuie să acordăm credit NVIDIA - a urmat cursul corect și a adaptat motorul fizic PhysX la arhitectura sa CUDA, iar acum fiecare proprietar al unei plăci video cu această arhitectură primește accelerare hardware a proceselor fizice în jocuri prin simpla actualizare a driverelor.

Atunci când lucrează cu un cip video puternic, PhysX poate oferi multe efecte noi, cum ar fi efecte dinamice de fum și praf, simulare de țesut, simulare de lichid și gaz, efecte meteorologice etc. Potrivit NVIDIA în sine, noile plăci video GeForce GTX 280 sunt capabile să funcționeze de 10 ori sau mai mult mai rapid decât procesoarele cu 4 nuclee atunci când lucrează cu PhysX. În prezent, suportul PhysX este implementat în peste 150 de jocuri.

Tehnologie îmbunătățită de gestionare a energiei

Noul cip video folosește un management îmbunătățit al energiei în comparație cu generația anterioară de cipuri NVIDIA. Schimbă în mod dinamic frecvențele și tensiunile blocurilor GPU în funcție de sarcina lor și este capabil să dezactiveze parțial unele dintre blocuri. Drept urmare, GT200 reduce semnificativ consumul de energie în momentele de inactivitate, consumând aproximativ 25 de wați, ceea ce este foarte scăzut pentru un GPU de acest nivel. Soluția acceptă patru moduri de operare:

Mod inactiv sau 2D (aproximativ 25 wați);
Modul de vizionare video HD/DVD (aproximativ 35 wați);
modul 3D complet (până la 236 wați);
modul HybridPower (aproximativ 0 watt);

Pentru a determina sarcina, GT200 folosește blocuri speciale care analizează fluxurile de date din interiorul GPU-ului. Pe baza datelor de la acestea, șoferul setează dinamic modul de performanță adecvat, selectează frecvența și tensiunea. Acest lucru optimizează consumul de energie și disiparea căldurii de pe card.

Ne-am familiarizat cu inovațiile și caracteristicile - în acest sens, NVIDIA și-a atins obiectivul prin introducerea unui cip grafic complet nou. Rămâne însă un al doilea obiectiv - acela de a dovedi superioritatea în ceea ce privește performanța. Pentru a face acest lucru, ne vom uita la cipul GT200 deja implementat sub forma unei plăci video finite, îl vom testa și vom compara toată puterea încorporată în el cu produsele emblematice ale generației anterioare și cu soluțiile concurenților.

Placa videopeNVIDIA GeForce GTX 280

După ce a stârnit interesul pentru acceleratorul grafic, să trecem direct la revizuirea, testarea, compararea și, bineînțeles, overclockarea acestuia. Dar mai întâi, încă o dată specificația, acum a unui accelerator serial gata făcut.

Producător
Nume	ENGTX280/HTDP/1G/A
Nucleul grafic	NVIDIA GeForce GTX 280 (G200-300-A2)
Transportor	240 de streaming unificat
API-uri acceptate	DirectX 10.0 (Shader Model 4.0) OpenGL 2.1
Frecvența de bază (domeniu shader), MHz
Volumul memoriei (tip), MB
Frecvența memoriei (eficientă), MHz
Autobuz de memorie	512 biți
Autobuz standard	PCI Express 2.0 x16
Rezolutie maxima	Până la 2560 x 1600 în modul Dual-Link DVI Până la 2048 x 1536 la 85 Hz prin VGA analogic Până la 1080i prin HDTV-Out
	2x DVI-I (2x VGA prin adaptoare) Ieșire TV (HDTV, S-Video și Compozit)
Suport HDCP Decodare video HD	Mânca H.264, VC-1, MPEG2 și WMV9
Șoferii	Drivere noi pot fi descărcate de la: - site suport; - Site-ul producătorului GPU-ului.
Site-ul producatorului

Placa video este furnizată într-o cutie de carton dublă destul de mare. Dar, spre deosebire de ambalajul acceleratoarelor anterioare de top, acesta este puțin mai mic ca dimensiune și nu are un mâner de plastic, se pare că ASUS a început să economisească carton.

Dar una dintre părțile laterale ale pachetului încă se deschide sub forma unei cărți, spunând cumpărătorului despre capacitățile extreme ale acceleratorului grafic și ale tehnologiilor proprietare.

Pe spatele pachetului, pe lângă listarea capacităților generale ale plăcii video și ale software-ului proprietar, sunt indicate cu atenție informații despre cerințele minime pentru sistemul în care va fi instalat ASUS ENGTX280/HTDP/1G/A. Cea mai interesantă și critică parte este recomandarea de a folosi o sursă de alimentare de minim 550 W care este capabilă să furnizeze până la 40 A de-a lungul liniei de 12V. De asemenea, sursa de alimentare trebuie să ofere numărul necesar de ieșiri de putere, la care vor fi conectate adaptoarele de alimentare.

În apropiere este afișată și schema corectă de alimentare a plăcii video. Vă rugăm să rețineți că pentru conectorul cu 8 pini se folosește un adaptor de la două PCI Express cu 6 pini, și nu de la o pereche de periferice, așa cum s-a putut vedea mai devreme la instalarea acceleratoarelor AMD/ATI. Având în vedere consumul de energie al GeForce GTX 280, va trebui să abordați mai atent sursa de alimentare.

În interiorul copertei colorate și informative, i.e. cutie exterioară, există o cutie interioară complet neagră, care, la rândul său, este împărțită în mai multe cutii și nișe separate care găzduiesc întregul set.

Pachetul este mai mult decât suficient pentru utilizarea completă a acceleratorului și, pe lângă adaptorul video în sine, include:

două discuri cu drivere, utilitare și o versiune electronică a manualului de utilizare;

ghid de hârtie pentru instalarea rapidă a unei plăci video;

mouse pad cu marca „piele”;

folder de marcă pentru discuri;

adaptor de la 2-x Molex (sursa de alimentare pentru dispozitive periferice) la sursa de alimentare cu 6 pini PCI-Express;

adaptor de la 2 PCI Express cu 6 pini la conector de alimentare cu 8 pini;

extensie conector de alimentare cu 8 pini;

Adaptor PCI Express cu 8 pini la 6 pini;

adaptor de la S-Video TV-Out la component HDTV-Out;

adaptor de la DVI la VGA.

Placa video de pe GeForce GTX 280 are aceleași dimensiuni ca și acceleratoarele de pe NVIDIA GeForce 9800 GX2 și este chiar asemănătoare ca aspect cu NVIDIA GeForce 9800 GTX, când privim partea frontală, care este complet ascunsă sub „ sistem de răcire familiar”. În general, aproximativ aceiași ingineri au fost implicați în dezvoltarea tuturor acestor acceleratoare și răcitoare ale acestora, așa că similitudinea externă nu este surprinzătoare.

Să remarcăm imediat că nu contează deloc cine este vânzătorul final al acceleratorului; plăcile video de top sunt produse direct de NVIDIA însăși la unitățile de producție ale partenerilor săi. Distribuitorii finali sunt implicați doar în ambalarea acceleratoarelor gata făcute și pot conta doar pe oportunitatea de a-și flash BIOS-ul proprietar, de a overclock ușor placa video sau de a înlocui cooler-ul cu unul alternativ.

Partea inversă a plăcii video este acum ascunsă în spatele unei plăci de metal, care, după cum s-a dovedit în timpul dezasamblarii, joacă rolul unui radiator pentru cipurile de memorie, aflate acum pe ambele părți ale plăcii de circuit imprimat.

Pe partea de sus a plăcii video, aproape la margine, există conectori pentru conectarea puterii suplimentare. Având un consum de energie de până la 236 W, acceleratorul necesită o sursă de alimentare fiabilă, care este asigurată de un conector PCI Express cu 6 pini și un conector cu 8 pini, ca la GeForce 9800 GX2 cu două cipuri.

Ascunsă sub un dop de cauciuc lângă conectorii de alimentare este o intrare audio digitală SPDIF, care ar trebui să asigure amestecarea fluxului audio cu datele video atunci când se utilizează ieșirea HDMI.

Pe de altă parte, tot sub mufă, există un conector SLI dublu, care oferă suport pentru 3-Way SLI și vă permite să construiți un computer cu un sistem video incredibil de puternic.

Două DVI-uri sunt responsabile pentru ieșirea imaginii, care poate fi convertită în VGA sau HDMI folosind adaptoare, precum și TV-Out cu suport HDTV. Lângă conectorul de ieșire TV, lângă prizele de aer încălzit, există un indicator de alimentare al plăcii video care afișează starea sa actuală.

Sub sistemul de răcire există o placă de circuit imprimat, care în multe privințe seamănă cu soluțiile anterioare de top de pe G80 (de exemplu, GeForce 8800 Ultra), doar acum, datorită creșterii memoriei video la 1 GB, cipurile sunt situate pe ambele părți ale plăcii de circuit imprimat și nu sunt atât de dense. În plus, sistemul de alimentare a fost consolidat pentru a asigura funcționarea unui accelerator atât de puternic.

Principalul consumator de energie electrică este cipul NVIDIA G200-300 al celei de-a doua revizuiri, care se numește GeForce GTX 280. Acesta conține 240 de procesoare de flux unificate care funcționează la o frecvență de ceas de 1296 MHz, în timp ce restul nucleului funcționează la 602 MHz. . Schimbul de date cu memoria video se realizează printr-o magistrală de 512 biți. Acest GPU este capabil să ofere performanțe grafice incredibile, dar nu are capacități de procesare front-end.

Un cip NVIO2 separat este responsabil pentru toate intrările și ieșirile, iar locația sa „departe” de procesorul principal ne permite să vorbim despre absența diferitelor interferențe și interferențe, care ar trebui să ofere o imagine excelentă chiar și pe monitoarele analogice.

Produsele Hynix sunt folosite ca cipuri de memorie. Microcircuitele cu o tensiune de operare de 2,05 V au un timp de răspuns de 0,8 ms, adică. asigura funcționarea memoriei video la o frecvență efectivă de până la 2200 MHz. Cipurile de memorie funcționează la aceeași frecvență de ceas.

Să vorbim separat despre răcitor. Sistemul de răcire are un design familiar NVIDIA și ocupă slotul de expansiune adiacent plăcii video, asigurând îndepărtarea aerului încălzit din exteriorul carcasei.

Este interesant de remarcat faptul că nu numai plăcile de radiator din aluminiu, ci și întregul corp de răcire sunt responsabile pentru îndepărtarea căldurii, care este clar vizibilă din conectarea conductelor de căldură la acesta. Prin urmare, ventilarea plăcii video în orice mod convenabil poate oferi o îmbunătățire vizibilă a temperaturii acesteia. Și puțini proprietari ai acestui „monstru fierbinte” vor putea evita gândurile despre îmbunătățirea răcirii. Chiar și o sarcină scurtă și serioasă pe placa video face ca turbina să se rotească până la un maxim de 1500 rpm, ceea ce perturbă considerabil confortul acustic. Dar nici acest lucru nu scutește acceleratorul de o încălzire semnificativă.

Într-o carcasă închisă, bine ventilată, temperatura GPU-ului a depășit 100°C, iar aerul suflat de sistemul de răcire a sugerat că NVIDIA nu ar fi trebuit să introducă acest GPU până în vară - ar fi trebuit să fie până la iarnă, astfel încât un utilizatorul care cumpărase un accelerator foarte scump ar putea economisi la încălzire.

Pentru a preveni supraîncălzirea plăcii video, a trebuit să deschid carcasa și să direcționez un ventilator de uz casnic în direcția sa - acest lucru a asigurat o reducere a temperaturii GPU-ului cu 14 grade și cu 9 grade a întregii plăci video. În această poziție au fost efectuate toate testele și overclockarea ulterioară. Dar cu carcasa deschisă, răcitorul stoc părea puțin mai tare.

Dar în absența unei încărcări 3D, temperatura plăcii video scade semnificativ, ceea ce se realizează și printr-o reducere suplimentară a frecvențelor de operare și o scădere a tensiunii - în modul 2D placa video consumă cu 200 W mai puțin. Același fapt permite turbinei mai rece să se rotească mai încet, ceea ce o face aproape silențioasă.

În timpul testării, am folosit standul de testare a plăcii video nr. 1
Alege cu ce vrei să compari GeForce GTX280 1GB ASUS

Printre acceleratoarele cu un singur cip, soluția bazată pe NVIDIA GeForce GTX 280 ocupă, fără îndoială, o poziție de lider, dar ASUS ENGTX280/HTDP/1G/A nu depășește întotdeauna acceleratoarele cu două cipuri și configurațiile multi-GPU față de plăcile din generația anterioară, mai ales când folosind un procesor care nu este cel mai productiv .

procesor cu 2 nuclee vs 4 nuclee

Care va fi beneficiul utilizării unui procesor mai puternic, cum ar fi unul quad-core? Aceste procesoare sunt acum adesea recomandate proprietarilor de plăci video de înaltă performanță.

Pentru a verifica dacă un procesor quad-core ar fi de preferat, am înlocuit Intel Core 2 Duo E6300 @2800 cu un Intel Core 2 Quad Q9450 @2800.

Pachet de testare	Intel Core 2 Duo E6300 @2800	Intel Core 2 Quad Q9450 @2800	Creșterea productivității, %

După cum puteți vedea, există într-adevăr o creștere a performanței la un procesor quad-core, și uneori destul de mult, dar este la rezoluții mari, pentru care se cumpără plăci video scumpe, accelerația este cea mai mică.

IntelMiez 2 QuadîmpotrivaAMD Phenom X4

O altă recomandare frecvent exprimată în ceea ce privește configurarea unui sistem de gaming performant este preferința pentru procesoarele Intel, acestea fiind mai rapide. Ei bine, să încercăm să verificăm în practică cât de lent va fi un sistem de gaming bazat pe procesorul AMD Phenom X4 dacă apare un astfel de fapt.

Pentru a „rula” în condiții egale, am overclockat procesorul AMD Phenom X4 9850 Black Edition la o frecvență de 2,8 GHz, ceea ce este destul de ușor de făcut doar schimbând multiplicatorul și am efectuat o serie de teste pe noul ASUS M3A32-MVP. Platformă DELUXE/WIFI-AP. În același timp, memoria RAM a funcționat în modul DDR2-800 cu aceleași timpi ca pe un sistem cu procesor Intel Core 2 Quad Q9450.

Pachet de testare	AMD Phenom X4 9850 @2800	Intel Core 2 Quad Q9450 @2800	Diferență de performanță, %




Serious Sam 2, calitate maximă, AA4x/AF16x, fps


Call Of Juarez, calitate maximă, NU AA/AF, fps


Call Of Juarez, Calitate Maximă, AA4x/AF16x, fps


Pradă, calitate maximă, AA4x/AF16x, fps


Crysis, calitate maximă, NU AA/AF, fps


Crysis, calitate maximă, AA4x/AF16x, fps

Deci, când rulează la aceleași viteze de ceas, un sistem cu procesor Intel Core 2 Quad se dovedește de fapt a fi puțin mai rapid decât unul cu procesor AMD Phenom X4. În același timp, cu cât rezoluția este mai mare și cu cât cerințele de calitate a imaginii sunt mai mari, cu atât mai puțină superioritatea procesoarelor Intel. Desigur, folosind cea mai scumpă și productivă placă video, este puțin probabil ca cumpărătorul să economisească pe procesor și placa de bază, dar în alte condiții nu am recomanda „cu siguranță Intel Core 2 Quad”, ci am sugera cântărirea cu atenție a opțiunilor pentru sisteme cu procesoare de la AMD și Intel .

Overclockare

Pentru a overclocka placa video, am folosit utilitarul RivaTuner, în timp ce, după cum s-a menționat mai sus, carcasa era deschisă și un flux suplimentar de aer proaspăt către placa video a fost furnizat de un ventilator de uz casnic.

Ca urmare a overclockării, frecvența domeniului raster a crescut la 670 MHz, ceea ce este cu 70 MHz (+11,67%) mai mare decât valoarea implicită. Overclockarea domeniului shader s-a dovedit a fi puțin mai bună, iar indicatorii de frecvență, în contrast cu valorile implicite, au crescut cu 162 MHz (+12,5%). Dar overclockarea memoriei a depășit toate așteptările. S-a remarcat funcționarea stabilă la o frecvență efectivă de aproape 2650 MHz, care este cu 430 MHz (+19,5%) mai mare decât cea nominală. Remarcăm potențialul excelent de overclocking al acceleratorului testat, în special memoria video.

Acum să vedem cum overclockarea unei singure plăci video afectează performanța:

Pachet de testare	Frecvențe standard	Placă video overclockată	Creșterea productivității, %




Serious Sam 2, calitate maximă, AA4x/AF16x, fps


Call Of Juarez, Calitate Maximă, AA4x/AF16x, fps


Pradă, calitate maximă, AA4x/AF16x, fps


Crysis, calitate maximă, AA4x/AF16x, fps

Doar în cele mai dificile moduri video veți putea vedea un câștig de performanță de la overclocking. Acest rezultat era destul de previzibil. În același timp, este destul de rezonabil de observat că procesorul a devenit factorul limitator în aproape toate testele. Dar nu vom recomanda cu fermitate doar cele mai rapide procesoare proprietarilor de acceleratoare NVIDIA GeForce GTX 280, deoarece Chiar și cu un procesor dual-core care funcționează la 2,8 GHz, sau poate mai puțin, puteți juca aproape orice joc destul de confortabil la cele mai înalte setări la rezoluții înalte. În astfel de condiții, puteți vedea chiar și o creștere de la overclock. Dar, desigur, dacă este posibil, nu ar trebui să vă zgârciți cu procesorul dacă nu v-ați zgâriit cu placa video și sursa de alimentare.

Concluzii

Suntem forțați să admitem că toate plăcile video bazate pe GeForce GTX 280 astăzi sunt cele mai puternice acceleratoare grafice cu un singur cip care pot oferi performanțe suficiente în orice joc modern. Dar, pe de altă parte, acestea sunt cele mai scumpe plăci video moderne și cele mai pretențioase ca sursă de alimentare și, în general, cele mai „lacom” și mai fierbinți. Adică, GeForce GTX 280 s-a dovedit a fi cel mai bun din toate punctele de vedere, atât rău, cât și bun.

Vorbim în general despre acceleratoare pe GeForce GTX 280, deși eroul recenziei este ASUS ENGTX280/HTDP/1G/A, deoarece majoritatea sunt exact aceleași mostre de referință, diferind unele de altele doar prin autocolante, componente și ambalaje. . Prin urmare, atunci când alege o GeForce GTX 280 de la ASUS, cumpărătorul primește un pachet extins cu câteva bonusuri de marcă și o rețea largă de centre de servicii, dar în rest nu există superioritate față de ofertele concurenților.

Avantaje:

performanță foarte ridicată în aplicații de jocuri;
Suport DirectX 10.0 (Shader Model 4.0) și OpenGL 2.1;
suport pentru tehnologiile NVIDIA CUDA și NVIDIA PhysX;
suport pentru tehnologia 3-Way SLI;
potențial bun de overclocking.

Defecte:

sistemul de răcire ocupă 2 sloturi, nu este foarte eficient și nu este confortabil în funcționare silențioasă;
cost destul de mare al acceleratorului grafic.

Ne exprimăm recunoștința față de companieSRL PF Service (Dnepropetrovsk) pentru placa video furnizată pentru testare.

La scrierea acestui articol s-au folosit materiale de pe site http://www.ixbt.com/.

Articolul citit de 19856 ori

Abonați-vă la canalele noastre

Experimentați lumi de înaltă definiție, personaje realiste și forțe ale naturii atât de puternice încât palmele îți transpiră și inima îți bate viteza cu fiecare cadru. Dincolo de jocuri, vizionați filme Blu-ray și transcodificați videoclipuri de până la 7 ori mai rapid decât procesoarele tradiționale 1 .

GPU-uri GEFORCE GTX 200

JOCURI DIN CĂTRE

Dincolo de jocuri

Vă prezentăm NVIDIA GeForce GTX 280 și GeForce GTX 260

NVIDIA discută cu dezvoltatorii despre performanța GeForce GTX 200 pentru jocurile lor

GPU-urile NVIDIA GeForce GTX 200 duc jocurile și efectele dincolo de nivelurile văzute anterior

Demo Medusa de la NVIDIA și Tehnologia NVIDIA® PhysX™ și NaturalMotion.

Mai mult decât jocuri - GPU-urile NVIDIA GeForce GTX 200 accelerează cele mai recente aplicații pentru consumatori

Arhitectura unificată NVIDIA de a doua generație: Arhitectura de a doua generație oferă cu până la 50% mai multă performanță de joc față de prima generație prin 240 de nuclee de procesare îmbunătățite care oferă o putere incredibilă de umbrire.
NVIDIA PhysX™-Ready 1: Suport GPU GeForce pentru tehnologia NVIDIA PhysX, permițând o clasă complet nouă de interacțiune fizică a jocurilor pentru o experiență mai dinamică și mai realistă cu GeForce.
Tehnologia 3 NVIDIA SLI® 2: Tehnologia NVIDIA SLI cu 3 căi lider în industrie oferă o scalare uimitoare a performanței prin implementarea AFR (Alternate Frame Rendering) în 3 căi pentru cea mai rapidă soluție de jocuri din lume sub Windows Vista, cu drivere solide și de ultimă generație.
Tehnologia NVIDIA CUDA™ 3: Tehnologia CUDA deblochează puterea nucleelor de procesare ale GPU-ului pentru a accelera cele mai solicitante sarcini de sistem – cum ar fi codificarea video – oferind performanțe de până la 7x față de procesoarele tradiționale.
Tehnologia NVIDIA PureVideo® HD 4 Combinația de accelerare a decodării video de înaltă definiție și post-procesare care oferă o claritate fără precedent a imaginii, un videoclip neted, culori precise și scalare precisă a imaginii pentru filme și videoclipuri.
Tehnologia NVIDIA HybridPower™ 5 Vă permite să comutați de la placa grafică GeForce GTX 280 la placa de bază GeForce GPU atunci când rulați aplicații care nu necesită grafică intensivă pentru o experiență de PC silențioasă și cu putere redusă.

1 GPU-ul GeForce GTX 280 este livrat cu suport hardware pentru tehnologia NVIDIA PhysX. Driverele NVIDIA PhysX sunt necesare pentru a experimenta accelerarea GPU PhysX în joc. Consultați pentru mai multe informații.
Numai 2 versiuni certificate NVIDIA SLI ale GPU-urilor GeForce PCI Express. Un GPU GeForce GTX 280 trebuie să fie asociat cu un alt GPU GeForce GTX 280 (producătorul plăcii grafice poate fi diferit). SLI necesită o răcire suficientă a sistemului și o sursă de alimentare compatibilă. Vizitați www.slizone.com pentru mai multe informații și o listă a componentelor certificate SLI.
3 Necesită suport pentru aplicații pentru tehnologia CUDA.
4 Funcția necesită software video acceptat. Caracteristicile pot varia în funcție de produs.
5 Necesită placa de bază compatibilă cu NVIDIA HybridPower™.

Notă: specificațiile de mai jos reprezintă acest GPU așa cum este încorporat în designul plăcii grafice de referință NVIDIA. Specificațiile plăcii grafice pot varia în funcție de producătorul plăcii suplimentare. Vă rugăm să consultați site-ul web al producătorilor de carduri suplimentare pentru specificațiile reale de livrare.

Specificații motor GPU:

CUDA Cores	240
Ceas grafic (MHz)	602 MHz
Ceasul procesorului (MHz)	1296 MHz
Rata de umplere a texturii (miliard/sec)	48.2

Specificații memorie:

Ceas de memorie (MHz)	1107
Configurare memorie standard	1 GB
Lățimea interfeței memoriei	512 biți
Lățimea de bandă a memoriei (GB/sec)	141.7

Suport pentru caracteristici:

Pregătit pentru NVIDIA SLI®*	2 căi/3 căi
Pregătit pentru NVIDIA 3D Vision
Tehnologia NVIDIA PureVideo®**	HD
Pregătit pentru NVIDIA PhysX™
Tehnologia NVIDIA CUDA™
Tehnologia HybridPower™
GeForce Boost
Microsoft DirectX	10
OpenGL	2.1
Certificat pentru Windows 7

Suport pentru afișare:

Rezoluție digitală maximă	2560x1600
Rezoluție VGA maximă	2048x1536
Conectori de afișare standard	HDTV Dual Link DVI
Monitor multiplu
HDCP
HDMI	Prin adaptor
Intrare audio pentru HDMI	SPDIF

Dimensiuni standard plăci grafice:

Înălţime	4,376 inchi (111 mm)
Lungime	10,5 inchi (267 mm)
Lăţime	Dual-slot

Specificații termice și de putere:

Temperatura maximă a GPU (în C)	105 C
Puterea maximă a plăcii grafice (W)	236 W
Puterea de sistem minimă recomandată (W)	550 W
Conectori de alimentare suplimentari	6-pini și 8-pini

Numărul de nuclee de procesor poate varia în funcție de model.
- Funcția necesită software video acceptat. Caracteristicile pot varia în funcție de produs.
- Redarea conținutului protejat cu HDCP necesită alte componente compatibile cu HDCP.
- Anumite GPU-uri GeForce sunt livrate cu suport hardware pentru tehnologia NVIDIA PhysX. Driverele NVIDIA PhysX sunt necesare pentru a experimenta accelerarea GPU PhysX în joc. Consultați www..
- Numai versiunile certificate NVIDIA SLI ale GPU-urilor GeForce PCI Express. Un GPU GeForce trebuie să fie asociat cu un GPU identic, indiferent de producătorul plăcii grafice. SLI necesită o răcire suficientă a sistemului și o sursă de alimentare compatibilă. Vizitați www.slizone.com pentru mai multe informații și o listă a componentelor certificate SLI.
- Necesită transmițător DisplayPort extern. Scanarea pe 10 biți per componentă necesită suport pentru driverele GeForce viitoare.
- Lățimea interfeței de memorie poate varia în funcție de model.
- Necesită placa de bază compatibilă NVIDIA HybridPower™.