Nvidia 780ti. Plăci video. La fel și citirile de temperatură

publicitate

Să ne amintim linia video Carduri NVIDIA. GeForce GTX 770, GTX 780, GTX Titan și GTX 690 - o clasificare ușor greșită, dar de înțeles a gamei de acceleratoare a companiei. Dar GTX 780 Ti? Pentru ce? Unde? Cu ce ​​să compar? Răspunsul nu este atât de simplu pe cât ar părea la prima vedere. Daca te gandesti bine...

Cea de-a șasea serie de GeForce a fost extrem de clară: fiecare model din următorul clasat se distingea printr-un număr mare în nume. Și apoi sunt plăci video cu un index care include 7x0. În același timp, GTX 690 nu a dispărut nicăieri, rămâne în continuare cea mai rapidă soluție dual-core. Poate că GTX Titan a intrat în grupul greșit? Ei bine, de ce nu, pentru că a venit pe piața de gaming din lumea calculelor și rămâne oferta supremă atât pentru gaming, cât și pentru computer.

Apare întrebarea - ar trebui NVIDIA să-l scoată din producție după lansarea GTX 780 Ti? Răspunsul este, de asemenea, simplu. Pentru ce? Este popular printre cei care au nevoie de calculatoare și pasionați, totuși, pentru jocuri, GTX 780 Ti ar trebui să fie cea mai bună alegere. Acest lucru se datorează faptului că utilizatorii primesc în sfârșit un GPU complet funcțional cu 2880 de procesoare de flux. Da, abia acum după anumite modificări, care vor fi discutate mai jos, GPU-ul GK110 este gata să se alăture aplicațiilor de gaming și să arate ce poate face.

Probabil, toată lumea se întreabă de ce GK110 a primit un nou nume, sau mai degrabă B1 stepping, și nu spune A2? Se crede că numerele indică remedieri în conexiunile metalice din interiorul GPU-ului. Literele se referă la modificări ale tranzistorilor înșiși. În orice caz, nu există schimbări radicale în interiorul cristalului - este încă același GK110. Tot ce trebuia să facă NVIDIA a fost să adapteze versiunea completă a GK110 la disiparea necesară a căldurii la frecvențele calculate, iar acest lucru nu a fost ușor de făcut.

Secretul evoluțiilor companiei este acoperit cu un astfel de văl de secret, încât este aproape imposibil să obții răspunsuri inteligibile, pur și simplu vei fi bombardat cu reclame sau fraze generale din care este imposibil să afli datele tehnice. Ei bine, secretele trebuie păstrate nedezvăluite, chiar și în cazul întrebărilor ascuțite din partea presei. Din partea noastră, se poate doar ghici ce trucuri au trebuit să fie luate pentru a încadra noua revizuire a GPU-ului în intervalul de consum de energie alocat.

publicitate

Caracteristici tehnice

După cum ați înțeles deja, nu există modificări fizice în circuitele logice principale. Poate că există optimizări în interior care reduc timpul necesar pentru finalizarea sarcinilor în interiorul GPU-ului, ceea ce duce la o cantitate mai mică de tranzistori care funcționează simultan. Această schemă de lucru există de mult timp și se numește „siliciu închis”. Toate cele 7,1 miliarde de tranzistoare care funcționează în același timp nu pot fi răcite de niciun sistem, ceea ce înseamnă că trebuie să monitorizați constant echilibrul, pe de o parte, performanța, iar pe de altă parte, frecvența, consumul de energie și temperatura rezultată din acestea. . Cu cât obloanele funcționează mai bine și mai economic, iar temperatura este menținută mai scăzută, cu atât calculele au loc mai repede.

Chiar înainte de apariția Hawaii de la un concurent, NVIDIA a introdus mai multe prevederi pentru funcționarea GPU-ului. Deci, frecvența de bază este cel mai scăzut nivel de funcționare a GPU-ului, GPU Boost este frecvența medie a GPU-ului în jocuri. Cel mai adesea, chiar și după o lungă ședere a plăcii video sub sarcină de joc, GPU Boost a menținut frecvența GPU puțin mai ridicată decât cea declarată. AMD a mers pe cealaltă direcție - singurul mod în care placa video își realizează pe deplin puterea este „Normal” sau, așa cum este numit și, modul Uber.

Dar, spre deosebire de un concurent, NVIDIA consideră că utilizatorul nu trebuie să se ocupe nici de comutatoarele BIOS, nici de setările din drivere - placa video va face totul pentru ei și de la sine. Și ceea ce poate fi reproșat cu adevărat de către dezvoltatorul GeForce este că limita fixă ​​de consum de energie este prea aproape de setarea din fabrică. Rămâne de văzut dacă inginerii au rezolvat cu adevărat problema generală a creșterii puternice a consumului de energie?

Specificații

NumeR9 290R9 290XGTX 690GTX 780GTX 780 TiGTX Titan
nume de codHawaiiHawaiiGK104GK110GK110GK110
Tehnologia proceselor, nm 28 28 28 28 28 28
Dimensiunea miezului/miezelor, mm 2 438 438 294x2 521 521 521
Număr de tranzistori, milioane 6200 6200 3540x2 7100 7100 7100
Frecvența miezului, MHzPână la 950Până la 1000 915 (1020) 860 (900) 880 (930) 840 (880)
Număr de shadere (PS), buc. 2560 2816 3072 2304 2880 2688
Număr de blocuri de rasterizare (ROP), buc. 64 64 64 48 48 48
Număr de unități de textură (TMU), buc. 160 176 256 192 240 224
Viteza maximă de umplere, Gpix/s 60.6 64 58.6 41.4 42 40.2
Rata maximă de preluare a texturii, Gtex/s 151.5 176 234.2 165.7 210.2 187.5
Versiune pixel/vertex shader 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0
Tipul memorieiGDDR5GDDR5GDDR5GDDR5GDDR5GDDR5
Frecvența efectivă a memoriei, MHz 5000 5000 6000 6000 7000 6000
Dimensiunea memoriei, MB 4096 4096 2048x2 3072 3072 6144
Bus de memorie, bit 512 512 256x2 384 384 384
Lățimea de bandă a memoriei, GB/s 320 320 192x2 288.4 336 288.4
Consum de energie (2D/3D), Wnd/ndnd/ndnd / 300nd / 250nd/ndnd / 250
CrossFire/Slidadadadadada
Prețul recomandat la momentul anunțării, $ 399 549 999 499 699 999

Aspect și dimensiuni

  • Analiza rezultatelor mediei geometrice, atractivitatea achiziției și măsurarea consumului de energie
  • publicitate

    Introducere

    După lansarea soluțiilor emblematice cu un singur procesor de la AMD - Radeon R9 290X și Radeon R9 290, NVIDIA și-a pierdut liderul pe piața plăcilor grafice pentru jocuri, deoarece acceleratoarele GeForce GTX Titan și GTX 780 au pierdut în fața concurenților direcți.

    Cu toate acestea, compania nu a suportat această stare de lucruri și, într-un timp destul de scurt, NVIDIA și-a lansat răspunsul la acțiunile adversarului - placa video GeForce GTX 780 Ti 3072 MB. De ce este remarcabil și datorită ce resurse ascunse va putea noutatea să concureze cu modele opuse?

    În primul rând, se bazează pe un GPU GK 110 complet și netăiat, care include 2880 de procesoare shader unificate, 240 de unități de textură și 48 de unități de operații raster. GPU-ul în sine rulează la 876 MHz.

    În al doilea rând, frecvența efectivă a memoriei video a fost de 7000 MHz, ceea ce împreună cu magistrala de 384 de biți a făcut posibilă creșterea lățimii de bandă a memoriei video la 336 GB/s. Acest lucru s-a dovedit a fi suficient pentru a nivela magistrala de schimb de memorie de 512 biți placi video Radeon R9 290X cu lățime de bandă de memorie video de 320 GB/s.

    publicitate

    În acest test, vom explora de ce este capabil noua NVIDIA.

    Rivalele GeForce GTX 780 Ti 3072 MB sunt:

    • GeForce GTX Titan 6144 MB;
    • GeForce GTX 780 3072 MB;
    • GeForce GTX 770 2048 MB;
    • GeForce GTX 680 2048 MB;

    • Radeon R9 290X 4096 MB;
    • Radeon R9 290 4096 MB;
    • Radeon R9 280X 3072 MB.

    Testați configurația

    Testele au fost efectuate pe urmatorul stand:

    • CPU: Intel Core i7-3770K (Ivy Bridge, D2, L3 8 MB), 1.0 V, Turbo Boost / Hyper Threading - oprit - 3500 @ 4600 MHz (1.25 V);
    • Placa de baza: GigaByte GA-Z77X-UD5H, LGA 1155, BIOS F14;
    • Sistem de racire CPU: Corsair Hydro Series H100 (~1300 rpm);
    • RAM: 2 x 4096MB DDR3 Geil BLACK DRAGON GB38GB2133C10ADC (Spec.: 2133MHz / 10-11-11-30-1t / 1.5V) , X.M.P. - oprit;
    • Subsistemul disc: SSD ADATA SX900 de 64 GB;
    • Unitate de alimentare: Thermaltake Toughpower 1200 wați (ventilator standard: 140 mm suflare);
    • Cadru: stand de testare deschis;
    • Monitor: 27" ASUS PB278Q BK (LCD lat, 2560x1440 / 60Hz).

    Plăci video:

    • Radeon R9 290X 4096 MB - 1000/5000 @ 1130/5800 MHz (Sapphire);
    • Radeon R9 290 4096 MB - 947/5000 @ 1120/5800 MHz (Sapphire);
    • Radeon R9 280X 3072 MB - 1000/6000 @ 1150/7000 MHz (Gigabyte);

    • GeForce GTX 780 Ti 3072 MB - 876/7000 @ 1110/7700 MHz (MSI);
    • GeForce GTX Titan 6144 MB - 837/6008 @ 970/7200 MHz (Gigabyte);
    • GeForce GTX 780 3072 MB - 863/6008 @ 1000/7200 MHz (Palit);
    • GeForce GTX 770 2048 MB - 1046/7000 @ 1260/7800 MHz (Zotac);

    • GeForce GTX 680 2048 MB - 1006/6008 @ 1260/7100 MHz (Gainward).

    Software:

    • Sistem de operare: Windows 7 x64 SP1;
    • Drivere pentru placa video: NVIDIA GeForce 334.67 Beta și AMD Catalyst 14.1 BETA 1.6.
    • Utilitati: FRAPS 3.5.9 Build 15586, AutoHotkey v1.0.48.05, MSI Afterburner 3.0.0 Beta 18.

    Instrumente și metodologie de testare

    Pentru o comparație mai vizuală a plăcilor video, toate jocurile folosite ca aplicații de testare au fost lansate la rezoluții de 1920x1080 și 2560x1440.

    Benchmark-urile încorporate, FRAPS 3.5.9 Build 15586 și AutoHotkey v1.0.48.05 au fost folosite ca instrumente de măsurare a performanței. Lista aplicațiilor de jocuri:

    • Assassin's Creed 4 Steag de pirați(Nassau).
    • Batman: Arkham Origins (Gotham City).
    • Battlefield 4 (Tashgar).
    • Company of Heroes 2 (Etalon de referință).
    • Crysis (Etalon - Sat).
    • Far Cry 3 (Capitolul 2. Hunter).
    • GRILĂ 2 (Etalon).
    • Max Payne 3 (Capitolul 5. În viață, deși puțin bătut).
    • Metrou: Ultima lumină (benchmark).
    • Saints Row IV (începutul jocului).
    • Câini adormiți (benchmark).
    • Tom Clancy's Splinter Cell: Lista neagră (articolul zero).

    În toate jocurile măsurate minimȘi mediu Valorile FPS. În teste în care nu a existat posibilitatea de măsurare FPS minim, această valoare a fost măsurată de utilitarul FRAPS. vsync dezactivat în timpul testării.

    Să trecem direct la teste.

    • Partea 2 - Cunoștință practică
    • Partea 3 - Rezultatele testelor de jocuri (performanță)

    În această parte, vom studia placa video și vom face cunoștință cu rezultatele testelor sintetice. Un card de referință Nvidia a fost în laboratorul nostru.

    Taxa

    • GPU: Geforce Titan (GK110)
    • Interfata: PCI Express x16
    • Frecvența de operare a GPU (ROPs): 875-1020 MHz (875-1020 MHz nominal)
    • Frecvența memoriei (fizică (eficientă)): 1750 (7000) MHz (nominal - 1750 (7000) MHz)
    • Lățimea magistralei de schimb de memorie: 384 de biți
    • Numărul de unități de calcul din GPU / frecvența blocurilor: 15/875-1020 MHz (15/875-1020 MHz nominal)
    • Numărul de operații (ALU) într-un bloc: 192
    • Numărul total de operațiuni (ALU): 2880
    • Număr de unități de textură: 240 (BLF/TLF/ANIS)
    • Număr de blocuri de rasterizare (ROP): 48
    • dimensiuni: 270×100×37 mm (cardul ocupă 2 sloturi în unitatea de sistem)
    • Culoare textolită: negru
    • Consum de energie (vârf 3D/2D/sleep): 264/86/70W
    • mufe de ieșire: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
    • Suport pentru multiprocesare: SLI (hardware)

    Nvidia Geforce GTX 780 Ti 3072MB 384-bit GDDR5 PCI-E

    Cardul are 3072 MB de SDRAM GDDR5 plasați în 12 cipuri pe partea frontală a PCB.

    Cardul necesită putere suplimentară sub forma a doi conectori: 8 și 6 pini.

    Despre sistemul de racire.

    Nvidia Geforce GTX 780 Ti 3072MB 384-bit GDDR5 PCI-E

    Sistemul de răcire repetă complet răcitorul de referință de la GTX Titan. Coolerul are o formă tradițională închisă, cu un ventilator cilindric la capăt. Radiatorul de căldură presat pe miez are la bază o cameră de evaporare, în interiorul căreia se află un lichid volatil special. Placa inferioară a camerei este presată pe miez, căldura este transferată lichidului, care se evaporă și transportă căldura către placa superioară (care are aripioare de răcire), unde vaporii se condensează etc. Am vorbit deja despre astfel de o schemă de răcire modernă a acceleratoarelor superioare de mai multe ori.

    Ventilatorul conduce aerul prin radiatorul menționat mai sus și are o formă specială a rotorului, dând nivel redus zgomot. Trebuie sa spun ca la sarcina maxima zgomotul se simte in continuare usor, deoarece frecventa maxima rotație - peste 2200 rpm.

    Cipurile de memorie sunt răcite de radiatorul central (răcitorul are o placă specială presată pe cipurile de memorie și tranzistoarele blocului de putere).

    Am efectuat un studiu de temperatură folosind versiune noua 4.2.1 Utilitare EVGA PrecisionX (de A. Nikolaychuk AKA Unwinder) și au obținut următoarele rezultate.

    După 6 ore de rulare a cardului sub sarcină maximă de joc, temperatura maximă a miezului a fost de 84 de grade, ceea ce este mai mult decât normal pentru un accelerator atât de puternic.

    Echipamente. Cardul de referință a sosit în ambalaj OEM, așa că nu există kit.

    Instalare și drivere

    Configurația bancului de testare:

    • Calculatoare bazate pe Intel Core i7-3960X (Socket 2011):
      • 2 procesoare Intel Core i7-3960X (o/c 4 GHz);
      • CO Hydro SeriesT H100i Cooler CPU cu performanțe extreme;
      • CO Intel Thermal Solution RTS2011LC;
      • sistemică placa de baza asus Sabertooth X79 bazat pe chipset Intel X79;
      • Placa de baza MSI X79A-GD45(8D) bazata pe chipset Intel X79;
      • RAM 16 GB DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 MHz;
      • Seagate Barracuda 7200.14 3TB SATA2 hard disk;
      • WD Caviar Blue WD10EZEX 1TB SATA2 hard disk;
      • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
      • 2 surse de alimentare Corsair CMPSU-1200AXEU (1200 W);
      • Corsair Obsidian 800D Full Tower.
    • sistem de operare Windows 7 pe 64 de biți; DirectX11;
    • monitor Dell UltraSharp U3011 (30″);
    • monitor Asus ProArt PA249Q (24″);
    • Versiunea driverelor AMD Catalyst 13.11beta8; Versiunea Nvidia 331.70 (pentru GTX 780 Ti) / 331/58 (pentru alte Geforce)

    vsync este dezactivat.

    Teste sintetice

    Pachetele de teste sintetice pe care le folosim pot fi descărcate aici:

    • D3D RightMark Beta 4 (1050) cu o descriere la 3d.rightmark.org.
    • D3D RightMark Pixel Shading 2 și D3D RightMark Pixel Shading 3- teste ale pixel shaders versiunile 2.0 și 3.0, link .
    • RightMark3D 2.0 Cu descriere scurta: sub Vista fără SP1 , sub Vista cu SP1 .

    Ca teste sintetice pentru DirectX 11, am folosit exemple din SDK-urile Microsoft și AMD, precum și programul demonstrativ Nvidia. Primul este HDRToneMappingCS11.exe și NBodyGravityCS11.exe din SDK-ul DirectX (februarie 2010). Am preluat și aplicații de la ambii producători de cipuri video: Nvidia și AMD. DetailTessellation11 și PNTriangles11 au fost preluate din SDK-ul ATI Radeon (sunt și în SDK-ul DirectX). În plus, a fost folosit programul demonstrativ Realistic Water Terrain de la Nvidia, cunoscut și sub numele de Island11.

    Testele sintetice au fost efectuate pe următoarele plăci video:

    • Geforce GTX 780 Ti GTX 780 Ti)
    • Geforce GTX Titan cu parametri standard (în continuare GTX Titan)
    • Geforce GTX 780 cu parametri standard (în continuare GTX 780)
    • Radeon R9 290X cu parametri standard în modul „Uber Mode” (în continuare R9 290X)
    • Radeon HD 7990 cu parametri standard (în continuare HD 7990)

    Pentru a analiza rezultatele noii plăci video high-end Geforce GTX 780 Ti, aceste soluții au fost alese din următoarele motive. Geforce GTX Titan este un model exclusiv bazat pe același cip GK110, are mai multă memorie video și se vinde la un preț mult mai mare. Titan este cea mai puternică soluție cu un singur cip Nvidia de până acum și va fi interesant de văzut cât de mult este mai rapid noul produs. Comparația cu Geforce GTX 780 va fi interesantă pentru că este placa video mai puțin costisitoare a companiei, bazată pe același cip, dar cu un sfert mai puține unități de execuție active.

    De la compania rivală AMD, am ales două plăci video bazate pe diferite GPU-uri și chiar un număr diferit de GPU-uri pentru comparația noastră. Radeon R9 290X la momentul lansării noului produs Nvidia este cel mai apropiat concurent din punct de vedere al prețului și, în același timp, cea mai productivă placă video de la AMD. Iar Radeon HD 7990 are două cipuri video Tahiti simultan și nu este un concurent pentru GTX 780 Ti, dar va fi interesant de văzut cum se compară viteza unei soluții atât de puternice cu două cipuri cu cea mai bună soluție cu un singur cip de la Nvidia.

    Direct3D 9: puncte de referință Pixel Shaders

    Ne vom uita la testele de texturare și umplere (rată de umplere) din pachetul 3DMark Vantage puțin mai târziu, iar primul grup de pixel shaders pe care îl folosim include diverse versiuni de programe de pixeli de complexitate relativ scăzută: 1.1, 1.4 și 2.0, găsite doar în jocuri vechi, foarte simple pentru cipurile video moderne.

    GPU-urile moderne fac față cu ușurință celor mai simple teste, viteza soluțiilor puternice din ele se bazează întotdeauna pe diverse limitatoare, ceea ce este valabil mai ales pentru Geforce. Aceste teste nu sunt capabile să arate capacitățile cipurilor video moderne și sunt interesante doar din punctul de vedere al aplicațiilor de jocuri învechite. Performanța plăcilor video moderne în ele este adesea limitată de viteza de texturare sau de umplere, iar plăcile video Nvidia au încetat de mult să fie optimizate pentru astfel de sarcini, ceea ce se arată perfect de rezultatele comparației de astăzi.

    Uite, toate plăcile Geforce diferă ușor între ele ca viteză, diferența dintre GTX 780 Ti și Titan este de doar 1-4%, în timp ce cea teoretică este mult mai mare. Noul model de placă video lansat astăzi în această comparație, deși se dovedește a fi cel mai bun dintre plăcile Nvidia, este net inferior concurentului principal în fața Radeon R9 290X, care se dovedește întotdeauna a fi vizibil în față. Să ne uităm la rezultatele programelor de pixeli mai complexe ale versiunilor intermediare:

    Testul Cook-Torrance este mai intens din punct de vedere computațional, iar viteza din acesta depinde mai mult de numărul de ALU și de frecvența acestora, dar și de viteza TMU-urilor. Acest test este din punct de vedere istoric mai potrivit pentru soluțiile grafice AMD, deși noile plăci de bază Geforce de top bazate pe arhitectura Kepler arată și ele rezultate puternice, pe care le putem vedea din cifrele în general bune ale noului Geforce GTX 780 Ti.

    Cea mai puternică placă din familia Geforce GTX 700 s-a dovedit a fi mai rapidă decât exclusivul GTX Titan cu 5-6%, ceea ce este, de asemenea, mai puțin decât diferența teoretică și poate fi explicată doar prin accentul pus pe performanța unităților ROP. Noul produs de la Nvidia își depășește ușor concurentul principal la unul dintre teste - la testul Water, unde viteza de texturare este mai importantă, eu nu sunt performanța matematică, în care plăcile de bază AMD au oarecare avantaj. Prin urmare, în al doilea test, rezultatele Geforce GTX 780 Ti sunt ușor mai mici decât cele ale Radeon R9 290X. În medie, există o paritate clară în aceste teste.

    Direct3D 9: teste Pixel Shaders 2.0

    Aceste teste de DirectX 9 pixel shaders sunt mai complexe decât cele anterioare, sunt apropiate de ceea ce vedem în prezent în jocurile multiplatform și se încadrează în două categorii. Să începem cu shaderele mai simple din versiunea 2.0:

    • Maparea paralaxei- o metodă de cartografiere a texturii familiară din majoritatea jocurilor moderne, descrisă în detaliu în articolul „”.
    • Sticlă înghețată— o textură procedurală complexă a sticlei congelate cu parametri controlați.

    Există două variante ale acestor shadere: una cu accent pe calcule matematice și una cu preferință pentru preluarea valorilor din texturi. Luați în considerare opțiunile intensive din punct de vedere matematic, care sunt mai promițătoare în ceea ce privește aplicațiile viitoare:

    Acestea sunt teste universale, a căror performanță depinde atât de viteza unităților ALU, cât și de viteza de texturare; echilibrul general al cipului și eficiența execuției programelor de calcul sunt, de asemenea, importante în ele. Cercetările noastre anterioare arată că arhitectura GCN a AMD are performanțe semnificativ mai bune decât arhitectura grafică Kepler a Nvidia în aceste sarcini specifice și așa s-a întâmplat de data aceasta.

    În testul Frozen Glass, viteza depinde mai mult de performanța matematică, iar în cazul tuturor plăcilor Geforce, există întotdeauna un fel de barieră din cauza căreia plăcile Nvidia pierd aproape de două ori mai mult decât cele mai bune Radeon cu un singur cip. Geforce GTX 780 Ti este cu doar 1% mai rapidă decât GTX Titan, ceea ce nu face decât să confirme accentul ciudat pe performanță pentru toate Geforce.

    Dar la cel de-al doilea test Parallax Mapping, noua placă video Geforce GTX 780 Ti a arătat o performanță cu 15% mai mare decât cea a lui GTX Titan, care este deja foarte aproape de teorie. În ceea ce privește comparația cu un concurent, comparația noutății cu modelul rival Radeon HD R9 290X nu este cea mai roz - placa AMD este mai rapidă în acest test cu aproape o treime. Să luăm în considerare aceleași teste în modificare cu preferința eșantioanelor de la texturi la calcule matematice:

    În aceste condiții, poziția plăcilor video fabricate de Nvidia s-a îmbunătățit oarecum, pentru că în mod tradițional fac față mai bine obținerii texturii decât calculelor matematice. Dar Radeon R9 290X este încă înaintea noului produs de astăzi cu o marjă bună, mai ales la testul Frozen Glass, unde diferența rămâne obscenă. Noutatea este cu 4-12% mai rapidă decât GTX Titan, ceea ce este mai mult sau mai puțin în concordanță cu teoria. În ceea ce privește comparația cu R9 290X, GTX 780 Ti este doar aproape de acesta în testul Parallax Mapping și chiar și atunci diferența depășește 20%.

    Cu toate acestea, acestea erau sarcini învechite de mult, cu accent pe texturare, care nu se găsește aproape niciodată în jocuri. În continuare, ne vom uita la rezultatele a încă două teste de pixel shader, dar de data aceasta versiunea 3.0, cea mai dificilă dintre testele noastre de pixel shader pentru Direct3D 9. Acestea sunt mai indicative în ceea ce privește jocurile moderne pentru PC, dintre care multe sunt multiplatform. Testele diferă prin faptul că încarcă puternic atât ALU-uri, cât și unități de textură, ambele programe de umbrire sunt complexe și lungi și includ un număr mare de ramuri:

    • Cartografierea paralaxei abrupte- un tip mult mai „greu” de tehnică de cartografiere a paralaxei, descrisă și în articolul „Terminologia modernă a graficii 3D”.
    • Blană- un shader procedural care redă blana.

    Aceste teste nu mai sunt limitate de performanța doar a obținerii texturii sau a ratei de umplere, iar viteza acestora depinde mai ales de eficiența executării codului de shader complex. În cele mai grele teste DX9 din prima versiune a pachetului RightMark, plăcile video Nvidia au fost puțin mai puternice în anii precedenți, dar arhitectura GCN a ajutat plăcile video AMD să preia conducerea cel puțin în testul complex de cartografiere a paralaxei, mai ales după o ajustare atentă a driverele Catalyst.

    Produsul nou de top de la Nvidia demonstrează rezultate foarte bune în aceste sarcini, depășind cu 11% cele mai bune dintre predecesorii săi bazați pe același cip GK110, ceea ce este aproape de cifrele teoretice pentru diferența de performanță matematică. În ceea ce privește comparația cu cea mai puternică placă grafică de top bazată pe cipul Hawaii de la un concurent, GTX 780 Ti rămâne în urmă doar la testul de cartografiere paralaxă. Dar la testul cu blană tabla noua Radeon R9 290X a pierdut în continuare în fața Geforce GTX 780 Ti, deși nu cu mult. În general, la aceste teste situația este ambiguă.

    Direct3D 10: teste PS 4.0 pixel shader (texturare, buclă)

    A doua versiune a RightMark3D include două teste PS 3.0 deja familiare sub Direct3D 9, care au fost rescrise pentru DirectX 10, precum și alte două teste noi. Prima pereche a adăugat capacitatea de a activa auto-umbrirea și supraeșantionarea shader, ceea ce mărește suplimentar încărcarea cipurilor video.

    Aceste teste măsoară performanța pixelilor de nuanță în buclă cu un număr mare de mostre de textură (până la câteva sute de mostre per pixel în modul cel mai greu) și o încărcare ALU relativ mică. Cu alte cuvinte, ei măsoară viteza de obținere a texturii și eficiența ramificării în pixel shader.

    Primul test de pixel shader va fi Fur. La setările cele mai scăzute, folosește 15 până la 30 de mostre de textură din harta de înălțime și două mostre din textura principală. Detaliul efect - modul „High” crește numărul de mostre la 40-80, includerea supersampling „shader” - până la 60-120 de eșantioane, iar modul „High” împreună cu SSAA este caracterizat de „severitatea” maximă. - de la 160 la 320 de mostre de pe harta înălțimii.

    Să verificăm mai întâi modurile fără supraeșantionarea activată, acestea sunt relativ simple, iar raportul rezultatelor în modurile „Scăzut” și „Înalt” ar trebui să fie aproximativ același.

    Performanța în acest test depinde de numărul și eficiența TMU-urilor, precum și de eficiența executării programelor complexe. Și în versiunea fără supraeșantionare, rata de umplere efectivă și lățimea de bandă a memoriei au, de asemenea, un impact suplimentar asupra performanței. Rezultatele la detalierea nivelului „Înalt” sunt de până la o ori și jumătate mai mici decât atunci când „Scăzut”.

    În sarcinile de redare procedurală a blănii cu un număr mare de texturi, pe parcursul a câteva generații de arhitecturi grafice, AMD a redus diferența cu plăcile Nvidia, iar odată cu lansarea de cipuri video bazate pe arhitectura GCN, a luat complet conduce, iar acum plăcile Radeon sunt lideri în aceste comparații, ceea ce indică o eficiență ridicată a implementării acestor programe.

    Noua placă de top Geforce GTX 780 Ti depășește performanța model exclusivist GTX Titan cu 11-12%, ocolind alte soluții Nvidia, ceea ce este în conformitate cu teoria. Dar, având în vedere că în acest test chiar și plăcile de bază AMD din generația anterioară sunt mai rapide decât noua serie Geforce GTX 780, nu are sens să comparăm R9 290X și GTX 780 Ti - modelul AMD arată un rezultat prea mare, ca să nu mai vorbim. cardul cu cip dublu al generației anterioare, care a devenit cel mai rapid.

    Să ne uităm la rezultatul aceluiași test, dar cu supraeșantionarea „shader” activată, ceea ce dublează munca: poate ceva se va schimba în această situație, iar lățimea de bandă a memoriei cu rata de umplere va avea mai puțin efect:

    Situația este similară cu ceea ce am văzut în diagrama anterioară, dar plăcile grafice ale Nvidia sunt chiar puțin în urma rivalilor lor AMD. Noul Geforce GTX 780 Ti este, de asemenea, mai rapid decât GTX Titan cu până la 11%, ceea ce este aproape de diferența teoretică în performanța matematică. Din păcate, pierderea în fața unui concurent direct sub forma Radeon R9 290X este destul de impresionantă. Din nou, se confirmă că avantajul în astfel de calcule este clar cu cipurile AMD, care preferă calculele pixel cu pixel.

    Următorul test DX10 măsoară performanța executării de shadere de pixeli cu buclă complexă cu un număr mare de preluari de textură și se numește Steep Parallax Mapping. La setări scăzute, utilizează 10 până la 50 de mostre de textură din harta înălțimii și trei mostre din texturile principale. Când activați modul greu cu auto-umbrire, numărul de eșantioane este dublat, iar supraeșantionarea de patru ori acest număr. Cel mai complex mod de testare cu supereșantionare și auto-umbrire selectează de la 80 la 400 de valori ale texturii, adică de opt ori mai multe decât modul simplu. Mai întâi verific opțiuni simple fără supraeșantionare:

    Cel de-al doilea test Direct3D 10 pixel shader este mai interesant din punct de vedere practic, deoarece soiurile de cartografiere paralaxă sunt utilizate pe scară largă în jocuri, iar variantele grele, cum ar fi maparea paralaxă abruptă, au fost folosite de mult timp în multe proiecte, de exemplu, în jocurile de seria Crysis și Lost Planet. În plus, în testul nostru, pe lângă supraeșantionare, puteți activa auto-umbrirea, ceea ce crește încărcarea pe cipul video de aproximativ două ori - acest mod se numește „High”.

    Diagrama este în general similară cu cea anterioară, de asemenea fără SSAA inclus, iar de data aceasta Geforce GTX 780 Ti este în fața lui GTX Titan cu până la 16-18%, ceea ce este chiar mai mult decât diferența teoretică de viteză ALU. Cel mai probabil, viteza aici depinde și de lățimea de bandă a memoriei video. Dar, deoarece plăcile video Nvidia din acest test au întotdeauna rezultate mai proaste decât soluțiile concurente de la AMD, modelul Geforce GTX 780 Ti din testul D3D10 actualizat fără supersampling arată din nou rezultate mai proaste decât Radeon R9 290X, ca să nu mai vorbim de dual-chip HD 7990. Să vedem ce va schimba includerea supereșantionării:

    Totul este din nou aproximativ la fel ca în „Blăniță” - când sunt activate supraeșantionarea și auto-umbrirea, sarcina devine și mai dificilă, includerea combinată a două opțiuni simultan mărește încărcarea cărților de aproape opt ori, provocând o problemă serioasă. scăderea performanței. Diferența dintre indicatorii de viteză ai plăcilor video testate s-a schimbat doar puțin, includerea supereșantionării are un efect mai puțin decât în ​​cazul precedent.

    Încă o dată, vedem că soluțiile grafice Radeon din testele noastre de pixel shader D3D10 funcționează mai eficient decât cele Geforce concurente, iar placa de vârf Hawaii depășește Geforce GTX 780 Ti anunțată astăzi cu o marjă uriașă. În comparație cu alte plăci de bază Nvidia, noul produs prezintă performanțe mai bune, depășind cu 10-11% modelul GTX Titan, ceea ce este aproximativ așa cum ar trebui să fie în teorie. Este clar că GTX 780 este și mai în urmă. Să vedem ce se întâmplă în problemele pur computaționale.

    Direct3D 10: Benchmarks pentru PS 4.0 Pixel Shader (Calcul)

    Următoarele două teste de pixel shader conțin numărul minim de texturi pentru a reduce impactul performanței TMU. Ei folosesc un număr mare de operații aritmetice și măsoară cu precizie performanța matematică a cipurilor video, viteza de execuție a instrucțiunilor aritmetice în pixel shader.

    Primul test de matematică este Mineral. Acesta este un test de texturare procedurală complexă care utilizează doar două mostre de date de textură și 65 de instrucțiuni sin și cos.

    Rezultatele testelor matematice extreme corespund de obicei doar aproximativ diferenței de frecvențe și numărului de unități de calcul, ele sunt afectate de eficiența diferită a utilizării lor în soluții specifice, iar optimizarea driverului este, de asemenea, importantă. În cazul testului Mineral, noul Geforce GTX 780 Ti este cu doar 8% mai rapid decât GTX Titan, ceea ce este clar sub diferența teoretică de performanță matematică dintre ele. Probabil că un fel de limitare afectează, deoarece diferența de caracteristici nu poate fi explicată.

    După cum știm deja, arhitecturile AMD din astfel de teste au avut întotdeauna un avantaj semnificativ față de soluțiile concurente Nvidia, dar în arhitectura Kepler, compania californiană a reușit să crească numărul de procesoare de flux și performanța matematică de vârf a modelelor Geforce, începând cu GTX 680, a crescut serios. Putem vedea acest lucru în rezultatele primului nostru test matematic, unde cea mai bună placă video Geforce, deși încă inferioară plăcii bazate pe cipul Hawaii, este cu doar 9% înaintea concurentului său GTX 780 Ti. Cu toate acestea, judecând după prețuri, placa grafică Nvidia ar trebui să fie înainte, așa că mai este de lucru.

    Să luăm în considerare cel de-al doilea test al calculelor shader, care se numește Foc. Este mai greu pentru ALU și există o singură textură în el, iar numărul de instrucțiuni sin și cos a fost dublat, până la 130. Să vedem ce s-a schimbat odată cu creșterea încărcării:

    Dar în cel de-al doilea test matematic, vedem rezultate complet diferite pentru plăcile video unul față de celălalt. Diferența dintre GTX Titan și noutatea de astăzi în acest test a devenit și mai puțin teoretică - 19%. Aceasta este mult mai mult ca o adevărată diferență în performanța la matematică.

    Din păcate, chiar și cu asta rezultat puternic, noul top cu un singur cip al seriei Geforce GTX 700 de la Nvidia nu poate ține pasul cu concurentul său la preț mai mic de la AMD. Geforce GTX 780 Ti nu poate concura cu noua placă de bază a AMD, care este cu 12% mai rapidă la cel de-al doilea test de matematică. Singura veste bună este că GTX 780 Ti este în mod clar mai rapid decât GTX 780 și Titan.

    Direct3D 10: teste geometrie Shader

    Există două teste de viteză a geometriei shader în RightMark3D 2.0, prima opțiune se numește „Galaxy”, tehnica este similară cu „punct sprites” din versiunile anterioare ale Direct3D. Animă un sistem de particule pe GPU, un shader de geometrie din fiecare punct creează patru vârfuri care formează o particulă. Algoritmi similari ar trebui folosiți pe scară largă în viitoarele jocuri DirectX 10.

    Schimbarea echilibrului în testele de umbrire geometrie nu afectează rezultatul randării finale, imaginea finală este întotdeauna exact aceeași, doar metodele de procesare a scenei se schimbă. Parametrul „GS load” determină în ce shader sunt efectuate calculele - în vârf sau geometrie. Numărul de calcule este întotdeauna același.

    Să luăm în considerare prima versiune a testului „Galaxy”, cu calcule în vertex shader, pentru trei niveluri de complexitate geometrică:

    Raportul vitezelor cu complexitate geometrică diferită a scenelor este aproximativ același pentru toate soluțiile, performanța corespunde numărului de puncte, cu fiecare pas scăderea FPS este aproape de două ori. Această sarcină nu este prea dificilă pentru plăcile video moderne, iar performanța acesteia este limitată de viteza de procesare a geometriei și, uneori, de lățimea de bandă a memoriei.

    Există o oarecare diferență între rezultatele plăcilor video bazate pe cipuri Nvidia și AMD, din cauza diferențelor în conductele geometrice ale cipurilor acestor companii. Dacă în testele anterioare cu pixel shaders plăcile AMD au fost vizibil mai eficiente și mai rapide, atunci testele de geometrie arată că plăcile Nvidia se dovedesc a fi mai productive în astfel de sarcini, chiar și în ciuda creșterii numărului de blocuri de geometrie în Hawaii.

    Dar diferența dintre AMD și Nvidia nu mai este la fel de mare ca înainte. Soluțiile de performanță geometrică ale Nvidia au funcționat întotdeauna mai bine și, prin urmare, sunt mai rapide. Noul produs Geforce GTX 780 Ti de astăzi se dovedește a fi aproximativ egal în performanță cu soluția anterioară sub forma GTX Titan, ceea ce indică testarea performanței conductei geometrice. Să vedem cum se schimbă situația la transferul unei părți din calcule în geometrie shader:

    Când încărcarea s-a schimbat în acest test, cifrele s-au îmbunătățit ușor atât pentru soluțiile AMD, cât și pentru Nvidia. Plăcile video din acest test de umbrire geometrie reacționează slab la modificările parametrului de încărcare GS, care este responsabil pentru transferul unei părți din calcule la shaderul geometriei, astfel încât toate concluziile rămân aceleași. Noul Geforce GTX 780 Ti încă arată performanțe la egalitate cu alte plăci bazate pe cipul GK110. Iar rivalul Radeon R9 290X rămâne încă în urma lor, așa că nimic nu se schimbă în concluzii.

    „Hyperlight” este cel de-al doilea test al geometry shaders, care demonstrează utilizarea mai multor tehnici simultan: instanță, ieșire în flux, încărcare tampon. Utilizează crearea de geometrie dinamică prin desenarea în două buffere, precum și o nouă caracteristică în Direct3D 10 - ieșire în flux. Primul shader generează direcția razelor, viteza și direcția creșterii lor, aceste date sunt plasate într-un buffer, care este folosit de al doilea shader pentru randare. Pentru fiecare punct al fasciculului, într-un cerc sunt construite 14 vârfuri, în total până la un milion de puncte de ieșire.

    Un nou tip de program de umbrire este folosit pentru a genera „raze”, iar cu parametrul „GS load” setat la „Heavy” - și pentru a le desena. Cu alte cuvinte, în modul „Echilibrat”, shaders-urile geometriei sunt folosite doar pentru a crea și „crește” raze, ieșirea se realizează folosind „instanțare”, iar în modul „Heavy”, shader-ul geometriei se ocupă și de ieșire.

    Din păcate, „Hyperlight” pur și simplu nu funcționează pe toate plăcile grafice AMD moderne, inclusiv pe Radeon R9 290X de top. La un moment dat, o altă actualizare a driverului a făcut ca acest test pur și simplu să nu ruleze pe plăci de la această companie. De aceea, cel mai interesant test de geometrie al pachetului nostru, care presupune o sarcină mare pe geometry shader, nu poate spune nimic despre compararea plăcilor AMD și Nvidia.

    Dar cel puțin putem vedea ce s-a schimbat în cazul soluțiilor Nvidia. Rezultatele relative ale deciziilor în moduri diferite corespund aproximativ cu modificarea sarcinii: în toate cazurile, performanța se scalează bine și este aproape de parametrii teoretici, conform cărora fiecare nivel următor „Număr de poligon” ar trebui să fie puțin mai mic de două ori mai lent.

    Viteza de redare în acest test este limitată în principal de performanța geometriei, dar în cazul unei încărcări echilibrate de geometrie shadere, toate rezultatele sunt apropiate. Geforce GTX 780 Ti a arătat o viteză cu 6-8% mai mare decât nivelul Titan, ceea ce înseamnă că, evident, nu este vorba doar de performanță geometrică. Cu toate acestea, numerele se pot schimba serios în diagrama următoare, într-un test cu o utilizare mai activă a umbritoarelor de geometrie. De asemenea, va fi interesant să comparăm între ele rezultatele obținute în modurile „Echilibrat” și „Gre”.

    În acest test, cel mai important parametru este viteza de procesare a geometriei, cu care Nvidia se descurcă foarte bine, mai ales cu cipul GK110 complet deblocat, pe care se bazează modelul Geforce GTX 780 Ti în cauză. Datorită numărului mai mare de blocuri geometrice, Geforce GTX 780 Ti îl depășește pe GTX Titan cu 14-19%, iar acesta din urmă, la rândul său, este vizibil mai rapid decât placa mai tânără bazată pe cipul GK110, GTX 780.

    Direct3D 10: rata de preluare a texturii din vertex shaders

    Testele „Vertex Texture Fetch” măsoară viteza unui număr mare de texturi dintr-un vertex shader. Testele sunt similare în esență, așa că raportul dintre rezultatele cărților din testele „Pământ” și „Valuri” ar trebui să fie aproximativ același. Ambele teste folosesc cartografierea deplasării bazată pe date de eșantionare a texturii, singura diferență semnificativă este că testul „Waves” folosește salturi condiționate, în timp ce testul „Earth” nu.

    Luați în considerare primul test „Pământ”, mai întâi în modul „Detaliu efect scăzut”:

    Studiile anterioare au arătat că atât rata de umplere, cât și lățimea de bandă a memoriei pot afecta rezultatele acestui test, ceea ce este vizibil mai ales în modul ușor. Rezultatele plăcilor grafice Nvidia sunt adesea limitate la ceva ciudat, așa cum demonstrează rezultatele similare ale tuturor plăcilor grafice bazate pe GPU-ul GK110.

    Radeon R9 290X de top este de așteptat să fie cea mai rapidă dintre soluțiile cu un singur cip în comparație, iar noul Geforce GTX 780 Ti prezentat astăzi pierde în fața lui în toate modurile, chiar și în modul greu, unde diferența este cea mai mică. Noua placă de top Nvidia a depășit GTX Titan în acest test cu 10-13%, ceea ce este aproape de teorie. Să ne uităm la performanța din același test cu un număr crescut de texturi:

    Situația de pe diagramă s-a schimbat serios - rezultatele soluțiilor AMD în moduri grele s-au înrăutățit, în timp ce pentru Geforce au rămas aproape pe aceleași poziții. Acum, Radeon R9 290X arată un rezultat semnificativ mai mare decât viteza noutății Nvidia doar în modul cel mai simplu, iar în modurile medii și grele, Geforce GTX 780 Ti anunțat astăzi îl devansează. Diferența dintre GTX 780 Ti și GTX Titan este de 9-12%, ceea ce este în concordanță cu teoria.

    Să luăm în considerare rezultatele celui de-al doilea test de preluare a texturii din vertex shaders. Testul Waves are mai puține mostre, dar folosește salturi condiționate. Numărul de mostre de textură biliniară în acest caz este de până la 14 ("Detaliu efect scăzut") sau până la 24 ("Detaliu efect ridicat") per vârf. Complexitatea geometriei se modifică în mod similar cu testul anterior.

    Rezultatele din cel de-al doilea test de texturare a vârfurilor „Waves” sunt în general similare cu cele pe care le-am văzut în diagramele anterioare. Din anumite motive, performanța tuturor plăcilor Geforce bazate pe GK110 în modul light rămâne foarte scăzută și sunt de aproape două ori mai slabe decât viteza Radeon HD 7990 cu două cipuri. Viteza noului Geforce GTX 780 Ti de top. la acest test, topul cu un singur cip bazat pe GK110 s-a dovedit a fi cu 8-10% mai rapid decât GTX Titan. Luați în considerare a doua versiune a aceluiași test:

    În cel de-al doilea test de eșantionare a texturii, pe măsură ce sarcina a devenit mai dificilă, viteza tuturor soluțiilor a scăzut, iar plăcile video Geforce au avut de suferit în mod deosebit în mod grav în modurile de lumină. Rezultatele noutății de astăzi în fața Geforce GTX 780 Ti de la Nvidia au fost doar cu 5% mai bune decât GTX Titan bazat pe același cip, ceea ce sugerează că principala limită de performanță în acest test pentru plăcile video Nvidia este performanța unităților ROP, cel mai probabil.

    3DMark Vantage: teste de caracteristici

    Testele sintetice din pachetul 3DMark Vantage ne vor arăta ce am omis anterior. Testele de caracteristici din această suită de teste acceptă DirectX 10 și sunt interesante deoarece diferă de ale noastre și sunt încă relevante. Probabil, atunci când vom analiza rezultatele noii plăci video Geforce GTX 780 Ti din acest pachet, vom trage câteva noi concluzii utile care ne-au ocolit în testele din pachetele familiei RightMark.

    Test de caracteristică 1: Umplere cu textura

    Primul test măsoară performanța unităților de preluare a texturii. Folosit pentru a umple un dreptunghi cu valori citite dintr-o textură mică folosind coordonate multiple de textură care schimbă fiecare cadru.

    Eficiența plăcilor video AMD și Nvidia în testul de textură de la Futuremark este destul de mare, iar cifrele comparative ale modelelor sunt apropiate de parametrii teoretici corespunzători. Vechiul model de top Geforce GTX 780 Ti, care a fost lansat astăzi, este cu doar 2% mai rapid în acest test decât cea mai puternică placă video GTX Titan recent, care nu este prea aproape de teorie, trebuie să recunosc.

    Desigur, GTX 780 rămâne și mai mult în urma celor mai scumpe soluții Nvidia în ceea ce privește viteza de texturare. În ceea ce privește comparația plăcii Geforce GTX 780 Ti cu soluția Radeon R9 290X a concurentului, noua placă Nvidia este puțin mai rapidă decât placa bazată pe procesorul grafic Hawaii în ceea ce privește viteza texturii. Ce era de așteptat, pe baza indicatorilor teoretici.

    Test de caracteristică 2: Umplere de culoare

    A doua sarcină este testul ratei de umplere. Folosește un pixel shader foarte simplu, care nu limitează performanța. Valoarea interpolată a culorii este scrisă într-un buffer offscreen (țintă de randare) folosind amestecarea alfa. Folosește un buffer off-screen FP16 pe 16 biți, cel mai des folosit în jocurile care folosesc randarea HDR, așa că acest test este destul de oportun.

    În acest caz, nu este măsurată rata de vârf a blocurilor ROP, numerele din subtestul 3DMark Vantage arată performanța blocurilor ROP, ținând cont de cantitatea de lățime de bandă a memoriei video (așa-numita „rată de umplere efectivă”). , iar testul măsoară debitul, nu performanța ROP.

    Prin urmare, rezultatul plăcii Nvidia anunțate în testul de performanță al unității ROP s-a dovedit a fi cu 10% mai bun în comparație cu GTX Titan, deoarece există o diferență teoretică în lățimea de bandă a memoriei între ele. Același lucru este valabil și pentru avansul concurentului reprezentat de Radeon R9 290X - de fapt, viteza unităților ROP din placa AMD este mai mare, dar din cauza lățimii de bandă mai reduse a memoriei, pierde în fața noului Geforce GTX 780 Ti.

    Test de caracteristică 3: Maparea ocluziei paralaxei

    Unul dintre cele mai interesante teste de caracteristici, deoarece această tehnică este deja folosită în jocuri. Desenează un patrulater (mai precis, două triunghiuri) folosind tehnica specială Parallax Occlusion Mapping, care imită geometria complexă. Sunt utilizate mai degrabă operațiuni de urmărire a razelor care necesită mult resurse și o hartă de adâncime de înaltă rezoluție. Această suprafață este, de asemenea, umbrită folosind algoritmul Strauss greu. Acesta este un test al unui shader de pixeli foarte complex și greu pentru un cip video, care conține numeroase texturi în timpul urmăririi razelor, ramificării dinamice și calculelor complexe de iluminare Strauss.

    Acest test al pachetului 3DMark Vantage diferă de cele anterioare prin faptul că rezultatele din acesta depind nu numai de viteza calculelor matematice, de eficiența execuției ramurilor sau de viteza de preluare a texturii, ci de mai mulți parametri simultan. Pentru a obține viteză mare în această sarcină, este important echilibrul corect al GPU-ului, precum și eficiența executării shader-urilor complexe.

    În acest caz, atât performanța la matematică, cât și cea a texturii, și, eventual, viteza ROP, sunt importante, deoarece în acest „sintetic” de la 3DMark Vantage, noua Geforce GTX 780 Ti este cu doar 5% înaintea plăcii mai scumpe Nvidia, care nu prea face. corespund diferenței teoretice în viteza de texturare și performanța de calcul.

    Dacă comparăm noul produs cu soluția concurentului, atunci în acest test GTX 780 Ti nu poate concura cu Radeon R9 290X, ca să nu mai vorbim de dual-chip HD 7990, întrucât GPU-urile AMD sunt mai eficiente la acest test. sarcina specifica. Din păcate, diferența dintre GTX 780 și cel mai apropiat concurent este de 20%, ceea ce este destul de mult.

    Test de caracteristici 4: Pânză GPU

    Cel de-al patrulea test este interesant deoarece calculează interacțiunile fizice (imitarea pânzei) folosind un cip video. Se folosește simularea vârfurilor, folosind operația combinată a umbritoarelor de vârf și geometrie, cu mai multe treceri. Utilizați stream out pentru a transfera vârfuri de la o trecere de simulare la alta. Astfel, sunt testate performanța execuției de vertex și geometrie shader și viteza de stream out.

    Viteza de redare în acest test ar trebui, de asemenea, să depindă de mai mulți parametri simultan, iar principalii factori de influență ar trebui să fie performanța prelucrării geometriei și eficiența shaders-urilor geometriei. Dar imaginea de pe diagramă s-a dovedit a fi foarte ciudată, ambele plăci video Radeon arată o rată de cadre de aproximativ 130 FPS, iar rezultatele a trei Geforce au ajuns și ele la limită, dar deja la nivelul de aproximativ 95-100 FPS, deoarece am vazut mai devreme.

    Și totuși, noutatea este înaintea scumpului GTX Titan cu 7%, destul de ciudat. Noul model al familiei de top de la Nvidia arată o viteză cu o treime mai slabă decât placa concurenței mai vechi - Radeon R9 290X. Și toate acestea în ciuda faptului că performanța geometrică a plăcilor video Nvidia ar trebui să fie mai mare decât cea a soluțiilor concurente, deoarece au un număr mai mare de unități de execuție corespunzătoare. Vom verifica din nou performanța geometrică în benchmark-urile DirectX 11.

    Test de caracteristici 5: Particule GPU

    Un test pentru simularea fizică a efectelor bazate pe sisteme de particule calculate folosind un cip video. Se folosește și simularea vârfurilor, fiecare vârf reprezentând o singură particulă. Stream out este folosit în același scop ca în testul anterior. Sunt calculate câteva sute de mii de particule, toate sunt animate separat, se calculează și coliziunile lor cu harta înălțimii.

    Similar cu unul dintre testele noastre RightMark3D 2.0, particulele sunt desenate folosind un shader geometrie care creează patru vârfuri din fiecare punct pentru a forma particula. Dar testul încarcă blocuri de umbrire cu calcule de vârfuri, mai ales, stream-out este de asemenea testat.

    În cel de-al doilea test geometric de la 3DMark Vantage situația s-a schimbat, iar de această dată liderul clar este Radeon HD 7990 cu dublu cip, care astăzi este în afara competiției. Noul produs de la Nvidia a reușit să depășească placa GTX Titan bazată pe același cip GK110 cu doar 1%, ceea ce indică focalizarea pe performanța geometrică, cel puțin pentru plăcile Nvidia.

    Dacă comparăm viteza noutății Geforce cu singurul concurent de la AMD, atunci noua placă este foarte aproape de rivalul său - ambii arată rezultate similare în această sarcină. Și acesta este un rezultat bun pentru Radeon, deoarece costă mai puțin, și chiar mai devreme, testele sintetice de imitare a țesuturilor și particulelor din suita de teste 3DMark Vantage, care utilizează în mod activ geometrie shadere, au arătat că plăcile Nvidia sunt semnificativ înaintea modelelor AMD concurente. , iar acum nu este atât de evident.

    Test de caracteristică 6: Perlin Noise

    Ultimul test de caracteristici al pachetului Vantage este un test intensiv din punct de vedere matematic al cipului video, acesta calculează câteva octave ale algoritmului de zgomot Perlin în pixel shader. Fiecare canal de culoare folosește propria funcție de zgomot pentru a crește sarcina pe cipul video. Zgomotul Perlin este un algoritm standard folosit adesea în texturarea procedurală și folosește multă matematică.

    Într-un test pur matematic din pachetul Futuremark, care arată performanța de vârf a cipurilor video în sarcini limită, vedem o distribuție diferită a rezultatelor în comparație cu teste similare din pachetul nostru de teste. În acest caz, performanța soluțiilor nu se potrivește prea bine cu teoria și diferă de ceea ce am văzut mai devreme în testele matematice din pachetul RightMark 2.0.

    Plăcile grafice Radeon de la AMD, bazate pe cipurile de arhitectură GCN, se descurcă foarte bine în astfel de sarcini și arată rezultate mai bune în cazurile în care se efectuează „matematică” intensivă. Acest lucru nu se aplică decât pentru Radeon HD 7990 cu două cipuri, care, evident, a funcționat ineficient în acest caz. Totuși, dacă comparăm Geforce GTX 780 Ti anunțată astăzi cu Radeon R9 290X, acesta din urmă depășește placa Nvidia cu 18%.

    Placa video GTX 780 Ti care a ajuns astăzi pe piață a arătat o viteză chiar puțin mai mică decât modelul GTX Titan al aceluiași producător și bazat pe același cip, ceea ce nu este absolut în concordanță cu teoria. Noul produs de astăzi a depășit în continuare GTX 780 cu 11%, deși ar fi trebuit să câștige cu o marjă mult mai mare. Probabil că o anumită limitare a GPU Boost, care a scăzut frecvența lui GK110 în GTX 780 Ti în timpul ultimului test sintetic al pachetului, a avut un efect.

    Direct3D 11: Compute Shaders

    Pentru a testa noua soluție Nvidia pentru sarcini care utilizează caracteristici DirectX 11, cum ar fi tessellation și compute shaders, am folosit exemple din SDK-uri și demonstrații de la Microsoft, Nvidia și AMD.

    În primul rând, ne vom uita la benchmark-uri care folosesc umbritoare Compute. Aspectul lor este una dintre cele mai importante inovații în ultimele versiuni DX API, sunt deja folosite în jocuri moderne pentru a efectua diverse sarcini: post-procesare, simulări etc. Primul test arată un exemplu de randare HDR cu tone mapping din DirectX SDK, cu post-procesare folosind pixeli și compute shaders.

    Viteza de calcul în shader-urile de calcul și pixeli pentru toate plăcile AMD și Nvidia este aproximativ aceeași, deși au existat diferențe la plăcile video cu GPU-uri de arhitecturi anterioare (este curios că placa video de pe Hawaii a arătat-o ​​din nou, deși una mică ). Judecând după testele noastre anterioare, rezultatele problemei depind în mod clar nu numai de puterea matematică și eficiența de calcul, ci și de alți factori, cum ar fi lățimea de bandă a memoriei și performanța ROP.

    În acest caz, viteza plăcilor video se bazează pe lățimea de bandă a memoriei. Noua placă de bază de top a Nvidia a fost cu 12% mai rapidă decât predecesorul său, GTX Titan, în acest test. Dacă comparăm noul produs cu placa AMD, atunci Geforce GTX 780 Ti și concurentul direct Radeon R9 290X sunt aproximativ egale, deși placa Nvidia costă puțin mai mult.

    Al doilea test compute shader este, de asemenea, preluat din Microsoft DirectX SDK și arată o problemă de calcul gravitațională cu N-corpi (N-corpi), o simulare a unui sistem dinamic de particule care este supus forțelor fizice, cum ar fi gravitația.

    În cazul acestui test, alinierea forțelor între soluțiile diferitelor companii s-a dovedit a fi complet diferită. Plăcile grafice Nvidia au un avantaj distinct în aceste tipuri de sarcini de calcul, iar plăcile grafice Radeon nu funcționează foarte bine. Prin urmare, logic ar fi ca cea mai puternică placă de bază Nvidia, modelul Geforce GTX 780 Ti prezentat astăzi, care are mai multe unități de calcul active și funcționează la o frecvență înaltă, să câștige acest test.

    Dar nu, GTX 780 Ti în sarcina de calcul a pierdut din nou câteva procente în fața mai scumpului GTX Titan. Cel mai probabil, în sarcinile de calcul, frecvența GPU-ului GK110 în cazul unei plăci video de gaming scade sub nivelul setat în cazul versiunii „de calcul” – GTX Titan. Cât despre concurent, Radeon R9 290X a rămas mult în urmă, cu aproape jumătate în urma noului produs Nvidia.

    Direct3D 11: Performanța teselării

    Umbritoarele de calcul sunt foarte importante, dar o altă caracteristică nouă interesantă în Direct3D 11 este teselarea hardware. Am analizat-o în detaliu în articolul nostru teoretic despre Nvidia GF100. Tessellation a fost folosită de mult timp în jocurile DX11, cum ar fi STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 și altele. Unele dintre ele folosesc teselația pentru modele de personaje, altele pentru a simula o suprafață de apă sau un peisaj realist.

    Există mai multe scheme diferite pentru partiţionarea primitivelor grafice (teselare). De exemplu, teselație phong, triunghiuri PN, subdiviziunea Catmull-Clark. Deci, schema PN Triangles este utilizată în STALKER: Call of Pripyat și în Metro 2033 - Phong tesselation. Aceste metode sunt relativ rapide și ușor de implementat în procesul de dezvoltare a jocului și în motoarele existente, motiv pentru care au devenit populare.

    Primul test de teselare va fi exemplul de teselare Detail din SDK-ul ATI Radeon. Implementează nu numai teselarea, ci și două tehnici diferite de procesare pixel cu pixel: o simplă suprapunere a hărților normale și maparea ocluziei paralaxe. Ei bine, să comparăm soluțiile DX11 de la AMD și Nvidia în diferite condiții:

    Într-un simplu test de bumpmapping, viteza este cel mai adesea limitată de lățimea de bandă a memoriei sau de performanța ROP, iar rezultatul noii plăci video Geforce GTX 780 Ti confirmă acest lucru - este aproape identică cu viteza GTX Titan din acest test. Toate Geforce din acest subtest sunt cu mult în urma Radeon R9 290X, dar nu din cauza lățimii de bandă a memoriei, ci din cauza vitezei blocurilor ROP.

    În cel de-al doilea subtest, cu calcule per-pixel vizibil mai complexe, totul este ceva mai interesant. Eficiența efectuării unor astfel de calcule matematice în pixel shaders pentru cipurile de arhitectură GCN este mai mare decât pentru Kepler, așa că nu este de mirare că toate plăcile Nvidia au pierdut din nou în fața noii soluții bazate pe cip Hawaii. Radeon R9 290X bazat pe noul GPU este vizibil mai rapid, inclusiv noul Geforce GTX 780 Ti, care, la rândul său, l-a depășit pe GTX Titan cu un impresionant 18%, ceea ce corespunde aproximativ teoriei în ceea ce privește viteza calculelor matematice. .

    În testul cu teselație, rezultatul noutății este aproximativ același ca în primul subtest. Modelul GTX 780 Ti a arătat aproape aceeași viteză ca și GTX Titan, pierzând în fața rivalului său direct în fața Radeon R9 290X. S-a întâmplat așa, deoarece divizarea triunghiului în acest test de teselare este moderată și viteza din acesta nu se bazează pe performanța unităților de procesare a geometriei, astfel încât viteza de procesare a triunghiului a plăcilor de bază AMD este suficientă pentru a arăta rezultate bune.

    Al doilea test de performanță a teselării va fi un alt exemplu pentru dezvoltatorii 3D de la ATI Radeon SDK - PN Triangles. De fapt, ambele exemple sunt incluse și în SDK-ul DX, așa că suntem siguri că dezvoltatorii de jocuri își creează propriul cod pe baza lor. Am testat acest exemplu cu un factor de teselare diferit pentru a vedea cât de mult afectează performanța generală.

    Și în acest exemplu, se utilizează o geometrie mai complexă, prin urmare, o comparație a puterii geometrice a diferitelor soluții pentru acest test aduce alte concluzii. Toate soluțiile moderne prezentate în material fac față bine sarcinilor geometrice ușoare și medii, arătând viteză mare, dar în condiții dificile, GPU-urile Nvidia sunt încă mult mai productive.

    Modelul Geforce GTX 780 Ti anunțat astăzi a arătat un rezultat anormal de scăzut în comparație cu GTX Titan pe același cip GK110. Iar decalajul de 15-20% la cele mai simple trei niveluri de teselație nu poate fi explicat prin nimic, deoarece GTX 780 Ti este mai rapid decât Titan în toți parametrii teoretici (cu excepția cantității de memorie video). Probabil că vedem rezultatul unei erori software sub formă de drivere neoptimizate. Și numai cu cea mai complexă teselație, noutatea trage înainte, așa cum ar trebui.

    Iar comparația cu un concurent în condiții dificile pentru noutate este pozitivă, deoarece are mai multe blocuri geometrice față de Hawaii. Prin urmare, GTX 780 Ti este mult mai rapid decât placa AMD de nouă generație, dar numai în condiții severe, când viteza Radeon-ului este redusă serios, în timp ce noua placă Nvidia rămâne destul de ridicată.

    Să aruncăm o privire la rezultatele unui alt test, programul demonstrativ Nvidia Realistic Water Terrain, cunoscut și sub numele de Island. Această demonstrație folosește teselația și maparea deplasării pentru a reda o suprafață și un teren oceanic cu aspect realist.

    Testul Island nu este un test pur sintetic pentru măsurarea performanței GPU pur geometrice, deoarece conține atât pixeli complexi, cât și shadere de calcul, iar o astfel de încărcare este mai apropiată de jocurile reale care folosesc toate unitățile GPU și nu doar geometrice, ca și în trecut. teste de geometrie. Cu toate acestea, principalul lucru este încă încărcarea blocurilor de procesare a geometriei.

    Am testat soluțiile la patru factori diferiți de teselare - în acest caz, setarea se numește Dynamic Tesselation LOD. Dacă chiar la primul factor de divizare a triunghiului, când viteza nu este limitată de performanța blocurilor geometrice, noua placă video de top de la AMD arată un rezultat destul de ridicat, încercând să concureze cu Geforce, dar până la Nivelul GTX 780 Ti este scurt chiar și în acest caz. Și prin creșterea muncii geometrice, noul produs Nvidia merge mai departe.

    Plăcile video Nvidia sunt foarte rapide în acest test, noul Geforce GTX 780 Ti s-a dovedit a fi cu 5-10% mai rapid decât mai scumpul GTX Titan, așa cum ar trebui să fie în teorie, spre deosebire de testul anterior. Concurentul nu este încă suficient de rapid pentru a concura cu cardurile Nvidia, deși în jocuri reale sarcina pe blocurile geometrice este mult mai mică și totul va fi complet diferit acolo.

    Concluzii asupra testelor sintetice

    Rezultatele testelor sintetice ale plăcii video Geforce GTX 780 Ti, care a devenit cea mai puternică placă de bază din seria de top Nvidia, precum și rezultatele altor modele de plăci video produse de ambii producători de cipuri video discrete, au arătat că noua placă este una dintre cele mai puternice soluții de pe piață și ar trebui să concureze cu succes cu alte plăci de top, în ciuda prețului destul de mare.

    Principalul lucru pe care l-am determinat este că noul produs este în mod clar mai rapid decât Geforce GTX Titan în majoritatea testelor, și asta în ciuda unei diferențe notabile de preț în favoarea GTX 780 Ti. Pentru jocuri, nu este surprinzător faptul că noua placă a Nvidia este una dintre cele mai puternice oferte din gama superioară de preț. Cu excepția unor sarcini, modelul Nvidia anunțat astăzi a funcționat bine în comparație cu puternicul Radeon R9 290X. Setul nostru de teste sintetice a arătat că vor concura între ele în ceea ce privește performanța în jocuri, mai ales că soluțiile Nvidia au funcționat în mod tradițional mai bine acolo decât în ​​cele sintetice.

    Noul model Geforce GTX 780 Ti se adresează în mod clar acelor entuziaști care nu sunt pregătiți să facă compromisuri și plănuiesc să joace jocurile actuale și viitoare la setări maxime la cele mai înalte rezoluții și sunt dispuși să plătească ceva mai mulți bani pentru el decât Radeon concurent. R9 290X costă. Cei care și-au dorit deja să cumpere Geforce GTX Titan pentru jocuri vor fi cel mai încântați, iar cei care au cumpărat-o recent cel mai puțin. La urma urmei, noul model Nvidia este mai ieftin, dar în jocuri va fi și mai productiv. Să trecem la evaluarea performanței reale a GTX 780 Ti în jocuri în următoarea parte a articolului.

    Datorită lansării familiei de plăci video AMD Volcanic Islands, a început un boom puternic pe piața adaptoarelor grafice. Nvidia a scăzut chiar și prețurile plăcilor lor grafice de top, dar nici asta nu a ajutat. Trebuia să fac ceva și să schimb cumva situația în favoarea mea. Aveam nevoie de un model special care să ia flagship - AMD Radeon R9 290X și să-l scoată de pe lista concurenților.

    În principiu, nVidia are o astfel de placă video - aceasta este GeForce GTX TITAN. Aceasta este cea mai rapidă placă video pe un singur cip la momentul lansării. Dar prețul său este prea mare și pentru majoritatea este pur și simplu inaccesibil. Nici măcar nu toți jucătorii decid să cumpere unul. La urma urmei, pentru acești bani puteți cumpăra cu ușurință un computer bun, cu performanțe excelente.

    Și acum, nVidia a lansat în sfârșit o placă video care este mai bună decât concurentul său de la AMD și mai accesibilă - GeForce GTX 780 Ti. De asemenea, a devenit șeful familiei de plăci video GTX 7xx.

    Se poate presupune că acesta este un fel de atu pe care verdeții l-au ținut în mânecă. Pur și simplu s-a așteptat o anumită pauză și s-a ales momentul potrivit pentru lansare.

    Specificații

    Trei din cincisprezece blocuri mari din arhitectura Kepler - multiprocesoare de streaming - au fost returnate pe această placă video. Este mult mai puternic, mai ales în ceea ce privește instrucțiunile pentru shader și texturare.

    De asemenea, acceptă memorie video de 7 GHz, crescând astfel lățimea de bandă cu până la 14%.

    Dimensiunile versiunii de referință

    • Înălțime: 26,67 cm / 10,5 inchi
    • Lungime: 11,16 cm / 4,376 inchi
    • Lățime: două fante

    Specificații GPU

    • Miezuri CUDA: 2880
    • Ceas de bază: 875
    • Boost Ceas: 928
    • Rata de umplere a texturii: 210 (GigaTexels/s)

    Specificații de memorie

    • Viteza memoriei (Gbps): 7.0
    • Capacitate memorie: 3072 MB
    • Interfață de memorie: GDDR5 pe 384 de biți
    • Lățimea de bandă maximă a memoriei: 336

    Posibilitati

    • FXAA și TXAA: +
    • Suport pentru tehnologia NVIDIA SLI: +
    • video pur: +
    • Viziune 3D: +
    • PhysX: +

    Mediu software: CUDA

    • DirectX: 11
    • OpenGL: 4.3
    • Autobuz: PCI-E 3.0
    • Jocuri 3D: +
    • Blu Ray 3D: +

    Specificații

    • Rezoluție digitală maximă: 4096×2160
    • Rezoluție maximă VGA: 2048×1536
    • Conexiune media: HDMI, DisplayPort, Dual Link DVI-I, Dual Link DVI-D
    • Suport multi-display: +
    • HDCP: +
    • HDMI: +
    • Intrare audio HDMI: Internă

    Putere și temperatură

    • Temperatura maxima: 95
    • Consum de energie: 250 W
    • Minim Cerințe de sistem prin putere: 600 W
    • Conectori de alimentare: 6-pini și 8-pini

    Comparație între GTX 780 TI și GTX 780

    GeForce GTX 780 GeForce GTX 780 Ti
    GPU GK110 GK110
    Numărul de tranzistori 7,1 miliarde 7,1 miliarde
    Tehnologia proceselor, nm 28 28
    Frecvența tacului GPU, MHz: Ceas de bază / Ceas de creștere 863/900 875/928
    Procesoare de flux 2304 2880
    blocuri de textura 192 240
    Unități de rasterizare (ROP) 48 48
    Memorie video: tip, dimensiune, MB GDDR5, 3072 GDDR5, 3072
    Frecvența ceasului de memorie: reală (eficientă), MHz 1753 (7010) 1502 (6008)
    Lățimea magistralei de memorie, bit 384 384
    Interfață PCI-Express 3.0 x16
    Ieșire imagine
    Interfețe 1 x DL DVI-I
    1 x DL DVI-D
    1 x HDMI 1.4a
    1 x Display Port 1.2
    Rezolutie maxima VGA: 2048×1536
    DVI: 2560×1600
    HDMI: 4096x2160,
    DisplayPort: 4096×2160
    Consumul maxim de energie, W 250 250

    Producătorii

    MSI GTX 780 Lightning 3 GB

    Are o frecvență de bază: 980 MHz și o frecvență de memorie de 1502 MHz

    MSIGTX 780TwinFrozrJocuri 3GB

    ASUS GTX 780 DirectCU II OC 3 GB

    Are o frecvență de bază: 889 MHz și o frecvență de memorie de 1502 MHz

    EVGA GTX 780 Superclockat cu ACX Cooler 3 GB

    Are o frecvență de bază: 967 MHz și o frecvență de memorie de 1502 MHz

    Placa video Gigabyte GTX 780 WindForce OC 3 GB

    Are un ceas de bază de 954 MHz și un ceas de memorie de 1502 MHz

    PalitGTX 780SuperJetStream 3GB

    Are o frecvență de bază de 980 MHz și o frecvență de memorie de 1550 MHz

    MSI GTX 780 Gaming 6 GB

    Are un ceas de bază de 902 MHz și un ceas de memorie de 1502 MHz

    Comparație cu concurenții

    Specificații/Model AMD Radeon R9 290X nVidia GeForce GTX 780 nVidia GeForce GTX 780 Ti nVidia GeForce GTX Titan
    GPU Hawaii XT GK110 (GK110-300-A1) GK110 (GK110-425-B1) GK110 (GK110-400-A1)
    Proces tehnologic 28 nm 28 nm 28 nm 28 nm
    Numărul de tranzistori 6,2 miliarde 7,1 miliarde 7,1 miliarde 7,1 miliarde
    Viteza de ceas a GPU (frecvența de bază) 864 MHz 876 MHz 837 MHz
    Viteza de ceas a GPU (frecvență de creștere) 1.000 MHz 902 MHz 928 MHz 876 MHz
    Frecvența memoriei 1.250 MHz 1.502 MHz 1.750 MHz 1.502 MHz
    Tipul memoriei GDDR5 GDDR5 GDDR5 GDDR5
    Memorie 4.096 MB 3.072 MB 3.072 MB 6.144 MB
    Lățimea magistralei de memorie 512 biți 384 de biți 384 de biți 384 de biți
    Lățimea de bandă a memoriei 320,0 GB/s 288,4 GB/s 336 GB/s 288,4 GB/s
    Versiunea DirectX 11.2 11.1 11.1 11.1
    Procesoare de flux 2.816 2.304 2.880 2.688
    blocuri de textura 176 192 240 224
    Conducte de operațiuni raster (ROP) 64 48 48 48
    TDP > 250W 250 W 250 W 250 W

    Comparând 780 Ti cu concurenții săi, îi puteți înțelege avantajele și dezavantajele. De exemplu, numărul de procese de streaming nu este mult diferit de altele, dar debitul este încă puțin mai mare. Dar aici AMD are o cantitate mult mai mare de memorie video, frecvență Boost și rata de umplere a pixelilor. Acum, PowerTune și GPU Boost afectează foarte mult performanța. Și nu este atât de ușor să-l evaluezi. Deci, compararea tuturor acestor caracteristici de bază nu este atât de importantă.

    Overclocking și teste

    Overclockarea GTX 780 Ti este ceva. Placa video are rezerve ascunse semnificative.

    Inginerii companiei au făcut tot posibilul. Datorită unui cip mai avansat și unui sistem de alimentare îmbunătățit, îl puteți overclock cu 200 MHz fără a crește tensiunea.

    Teste în benchmark-uri

    Teste în jocuri

    Crysis 3

    În Crysis 3, placa video a arătat rezultate excelente, până la 36 fps la setările maxime.

    Războiul total ROMA II

    Acest joc este plin de diverse clopote și fluiere grafice moderne.

    La rezoluția FullHd, fps a variat între 65-99 la setările maxime.

    Chemarea datoriei: fantome

    La rezoluția FullHd, fps a variat de la 132 la 148 la setările maxime.

    concluzii

    Putem spune că GTX 780 Ti este un exemplu de placă grafică de înaltă calitate, concepută pentru jocuri serioase. Nvidia a făcut un pas înainte în dezvoltarea familiei de GPU-uri Kepler. Se poate susține că această arhitectură și-a atins plafonul.

    În principiu, reetichetarea vechilor SKU nu este un lucru rușinos, atâta timp cât prețurile scad constant. Să presupunem că notoriile Radeon R9 280X și GeForce GTX 770 costă acum cu 200-250 USD mai puțin decât predecesorii lor. Problema este că cipurile grafice cu adevărat noi și mai puternice, care sunt destinate nișei de preț libere din segmentul High-End, au trebuit să fie de asemenea lansate fără a aștepta ziua prețuită când TSMC va lansa procesul de fotolitografie de 20 nm.

    Atât pentru AMD, cât și pentru NVIDIA, a devenit o sarcină descurajantă să înghesuiți GPU-uri, care, conform legii lui Moore, ar trebui să includă de două ori mai mulți tranzistori decât cipurile lansate cu doi ani mai devreme, în aceleași wafer-uri rotunde de culoare fabricate la 28 nm. GeForce GTX TITAN de pe mult așteptatul cip GK110 a dat un gust de viitor doar celor care erau gata să plătească o sumă rotundă de 1.000 de dolari pentru el și chiar și GeForce GTX 780, fiind o versiune „ușoară” a lui GTX TITAN. , inițial nu s-a încadrat în prețul de 499-549 USD, standardul pentru adaptoarele video discrete de top, și a stabilit un nou bar la 650 USD (cu toate acestea, acum este deja 499 USD).

    Odată cu revenirea a trei dintre cele cincisprezece blocuri de construcție majore ale arhitecturii Kepler, multiprocesoarele de streaming, la GeForce GTX 780 Ti, noul flagship oferă performanțe de shader și texturare cu 20% mai rapide.

    La fel de important, NVIDIA a adus la GTX 780 Ti realizarea exclusivă a GeForce GTX 770 de suport pentru memorie video de 7 GHz, care contribuie la o creștere cu 14% a lățimii de bandă.

    Astfel, GTX 780 Ti este superior din toate punctele de vedere nu numai GTX 780, ci și GTX TITAN. Singurul avantaj al TITAN în comparație cu noutatea (pe lângă 6 GB de memorie) este nucleele CUDA de dublă precizie deblocate (FP64), al căror număr se corelează de la 1 la 3 cu nucleele FP32 din GK110. Prin urmare, TITAN poate funcționa potențial. calcule de dublă precizie în aplicații de calcul la o viteză de 1/3 față de FP32, iar GeForce GTX 780 Ti este limitată la o bară plictisitoare de 1/24.

    GTX 770GeForce GTX 780GeForce GTX TITANGeForce GTX 780 TiGeForce GTX 690
    Componentele principale
    GPU GK104 GK110 GK110 GK110 GK104
    Numărul de tranzistori 3.540 milioane 7,1 miliarde 7,1 miliarde 7,1 miliarde 2x3540 milioane
    Tehnologia proceselor, nm 28 28 28 28 28
    Frecvența tacului GPU, MHz: Ceas de bază / Ceas de creștere 1046/1085 863/900 836/876 875/928 915/1019
    Procesoare de flux 1536 2304 2688 2880 2x1536
    blocuri de textura 128 192 224 240 2x128
    ROP-uri 32 48 48 48 2x32
    Memorie video: tip, dimensiune, MB GDDR5, 2048 GDDR5, 3072 GDDR5, 6144 GDDR5, 3072 GDDR5, 2x2048
    Frecvența ceasului de memorie: reală (eficientă), MHz 1753 (7010) 1502 (6008) 1502 (6008) 1750 (7000) 1502 (6008)
    Lățimea magistralei de memorie, bit 256 384 384 384 2x256
    Interfață PCI-Express 3.0 x16
    Ieșire imagine
    Interfețe 1 x DL DVI-I
    1 x DL DVI-D
    1 x HDMI 1.4a
    1 x Display Port 1.2
    2 x DL DVI-I
    1 x DL DVI-D
    1 x Mini Display Port 1.2
    Max. permisiune VGA: 2048x1536
    DVI: 2560x1600
    HDMI: 4096x2160,
    DP: 4096x2160
    Max. consumul de energie, W 230 250 250 250 300
    Preț mediu de vânzare cu amănuntul, frecare. Nu există date Nu există date Nu există date Nu există date Nu există date

    Ei bine, acum să comparăm noutatea cu principalul rival - Radeon R9 290X. Să luăm ca date inițiale că placa grafică AMD rulează la o frecvență GPU de 1000 MHz, iar GTX 780 Ti rulează la ceasul mediu Boost (928 MHz). Acestea sunt condiții realiste, deoarece pentru Radeon R9 290X, cu o răcire bună, este destul de posibil să rămâneți la o frecvență de 1 GHz fără „throttling”, iar Boost Clock al GPU-urilor NVIDIA reflectă pe bună dreptate frecvența medie la care GPU-ul. funcționează sub sarcină.

    • În acest caz, performanța teoretică a matricei de shader GTX 780 Ti nu este mult, dar totuși mai mică decât cea a adversarului: 5345 față de 5632 FGLOPS (aproximativ 5%).
    • Pe de altă parte, în procesorul GTX 780 Ti există mult mai multe unități de textură - 240 față de 176. Aceasta înseamnă că filtrarea texturii - din nou ajustată pentru diferite frecvențe - este cu 21% mai rapidă pe GK110 decât pe AMD.
    • Hawaii mai are încă un sfert ROP - 64 vs 48, ceea ce cu siguranță nu va fi în favoarea plăcii video NVIDIA în teste la rezoluții mari: configurații multi-monitor, display-uri 4K. Chiar și la 2560x1440 efectul ar trebui să apară într-o oarecare măsură.
    • NVIDIA și AMD într-un mod diferit a crescut lățimea de bandă a memoriei video: magistrală de 512 biți și viteză de ceas de 5 GHz pentru Radeon R9 290X sau 384 de biți și 7 GHz pentru GeForce GTX 780 Ti. În ceea ce privește lățimea de bandă rezultată, datele sunt aproximativ aceleași - cu o marjă de aproximativ 5% în favoarea GTX 780 Ti (336 și, respectiv, 320 GB / s).
    • În ceea ce privește procesarea geometriei pe partea laterală a GeForce GTX 780 Ti, acesta îl depășește pe oponent cu o marjă largă. Deoarece fiecare dintre cele 15 multiprocesoare de streaming (SMX) din cip are propriul bloc Polymorph Engine capabil să producă un poligon pentru două cicluri, performanța totală a întregului nucleu GK110 este de 7,5 primitive geometrice pe ciclu. Radeon R9 290X are doar patru.
    • AMD Radeon R9 290 și R9 290X sunt capabile să efectueze calcule FP64 la 1/8 din viteza FP32. GeForce GTX 780 Ti, așa cum sa menționat mai sus, este limitat în mod intenționat la 1/24.

    În concluzie, avantajul GPU-ului GK110 complet funcțional față de AMD Hawaii este a) o rată de eșantionare a texturii mult mai mare (datorită a 240 de unități de filtrare), care, împreună cu performanța shaderului, rămâne principalul blocaj al GPU-ului în jocurile moderne. ; b) prelucrarea geometriei, care, de exemplu, este importantă în scenele încărcate cu teselații. Puterea lui Radeon R9 290X constă în numărul de ROP-uri (rezoluții înalte și anti-aliasing SSAA, care este acum din nou în vogă), iar performanța shaderului, conform estimărilor brute, nu este mai slabă decât cea a rivalului. Adică, în ciuda faptului că GK110 include cu un miliard de tranzistori mai mulți decât Hawaii, învingerea bebelușilor în benchmark-uri încă nu se va întâmpla.

    A mai rămas o singură întrebare, pe care am ignorat-o în recenziile Radeon R9 290 și R9 290X - cantitatea de memorie video. AMD își echipează flagship-urile cu 4 GB de frame buffer, în timp ce GeForce GTX 780 Ti se mulțumește cu 3 GB. Este prea devreme să spunem că această sumă nu este suficientă, dar, de exemplu, pentru Battlefield 4, 3 GB este deja o recomandare.

    ⇡ Preturi

    Oricum ar fi, prețul pe care NVIDIA l-a stabilit pentru GeForce GTX 780 Ti indică faptul că producătorul este complet încrezător în superioritatea necondiționată a urmașilor față de concurentul său de la AMD. Odată cu lansarea GeForce GTX 780 de bază de 640 USD, NVIDIA s-a instalat deja într-un spațiu peste bara obișnuită de 549 USD pentru plăcile grafice de gaming de ultimă generație, dar GTX 780 Ti s-a mutat și mai departe. Prețul de vânzare cu amănuntul sugerat pentru piața din SUA este de 699 USD, care este cu 150 USD mai mare decât Radeon R9 290X. Pentru Rusia, prețul recomandat este de 24.990 de ruble. Cu toate acestea, orice comparație orientativă a prețurilor conform listelor de prețuri din magazinele online rusești va fi posibilă numai după ce livrările mari ale ambelor produse noi vor ajunge pe piața noastră. De exemplu, la momentul scrierii acestui articol, exista o singură ofertă pentru Radeon R9 290X la Moscova și chiar și atunci - pentru aproape 25 de mii. Deci, deocamdată, pentru simplitate și fiabilitate, vom continua să ne gândim la prețurile din SUA.

    ⇡ G-SYNC

    Să acordăm puțină atenție celei mai recente inițiative a NVIDIA, care nu este direct legată de noul adaptor video emblematic, dar este interesant în sine. Se știe că compania verde a fost lider recent cruciadăîn numele unei imagini netede. NVIDIA a fost cea care a introdus tehnica FCAT, care a scos la iveală problemele senzaționale ale AMD CrossFire cu uniformitatea timpului de pregătire a cadrelor. Mai devreme, pentru toate plăcile video bazate pe arhitectura Kepler, a fost prezentată o soluție interesantă - Adaptive V-Sync, care pur și simplu activează sincronizarea verticală dacă frecvența cadrelor din bufferul plăcii video este de cel puțin 60 și o dezactivează dacă rata de cadre. scade mai jos. G-SYNC este o altă abordare originală a sincronizării pe verticală, care de data aceasta necesită, în anumite puncte, refacerea protocolului de comunicare între GPU și monitor.

    Dar mai întâi, să subliniem problema pe care sincronizarea verticală ca atare este concepută să o rezolve și de ce majoritatea jucătorilor obișnuiesc să o ignore sau să o considere un fel de dezavantaj inevitabil al graficii computerizate - ruperea ecranului.

    Acest lucru se întâmplă atunci când monitorul citește o imagine din frame-buffer-ul, în același timp, GPU-ul termină redarea următorului cadru și bufferele (dintre care sunt de fapt două) sunt schimbate. Drept urmare, acea parte a liniilor de pe ecran pe care monitorul a început să o „deseneze” după schimbarea bufferelor aparține altui cadru. Aici este decalajul, care, în mod logic, poate fi multiplu dacă diferența dintre rata de cadre și rata de reîmprospătare a ecranului este suficient de mare.

    Esența sincronizării verticale este că schimbarea bufferelor este interzisă până în momentul în care monitorul finalizează ciclul de actualizare a imaginii. În consecință, în timp ce conținutul unui buffer (numit Front Buffer) este afișat, doar un cadru următor poate fi scris în celălalt buffer (Bafferul din spate). În același timp, într-un sistem fără V-Sync, cu condiția ca GPU-ul să aibă o marjă mare de performanță, buffer-urile ar putea fi schimbate de mai multe ori, ceea ce ar duce la decalajul notoriu, dar decalajul de intrare ar fi mai mic. Dar aceasta este cea mai mică dintre cele două supraîncărcări de sincronizare verticală, care este mai mult decât compensată de celălalt efect.

    Monitorul solicită un cadru din memoria adaptorului grafic la o rată obișnuită (de exemplu, 60 Hz). Imaginați-vă o situație ideală în care GPU-ul redă și cadre la 60 FPS. Apoi fiecare dintre cadrele randate este afișat pe monitor o dată. Dar dacă un cadru este cel puțin puțin întârziat pentru următorul ciclu de reîmprospătare a monitorului, utilizatorul vede cadrul anterior de două ori, ceea ce este perceput ca micro-frânare (și în același timp - întârziere de intrare). În jocurile reale, când frecvența cadrelor fluctuează, acest eveniment se întâmplă mult mai des, iar o scădere pe termen lung sub 60 FPS duce la faptul că rata efectivă a cadrelor pe ecran este de 30 FPS, iar următorul pas este de 15 FPS. Din acest motiv, majoritatea jucătorilor se feresc de V-Sync, resemnați cu lacune urâte.

    G-SYNC este o soluție absolut radicală - pentru a forța monitorul să actualizeze ecranul la un interval arbitrar prin modificarea protocolului DisplayPort. Apoi, dacă următorul cadru nu este încă gata, dar randarea este pe cale să se termine, atunci monitorul poate, în anumite limite, să întârzie ciclul de reîmprospătare în loc să dubleze cadrul precedent.

    Pentru a suporta G-SYNC, trebuie să instalați un modul special pe monitor, care poartă un anumit cip cu logică și trei cipuri DRAM cu o capacitate totală de 768 MB pe placă. Până acum, un singur model are un conector pentru un astfel de modul - ASUS VG248QE, iar NVIDIA va începe să vândă placa în sine înainte de sfârșitul acestui an. După Crăciun, vor deveni disponibile variante ale ASUS VG248QE cu un modul preinstalat și o serie de monitoare de la alți producători care acceptă G-SYNC în mod nativ.

    joc de umbre

    Cu puțin timp înainte de lansarea GeForce GTX 780 Ti, o altă dintre tehnologiile exclusive ale NVIDIA a intrat în statutul unei versiuni beta funcționale, cu ajutorul căreia compania caută să-și diferențieze produsele de ofertele concurente. ShadowPlay profită de codificatorul H.264 (NVENC) integrat al GPU-ului Kepler pentru a captura filmări ale jocului. ShadowPlay are două funcții - în primul rând, înregistrarea video la cerere, așa cum se face cu FRAPS sau alte soluții pur software. Și în al doilea rând, ShadowPlay poate pur și simplu să captureze continuu în fundal și să păstreze în memorie ultimele 20 de minute ale jocului, care sunt salvate într-un fișier container MP4 prin apăsarea unei taste rapide.

    Setările ShadowPlay sunt accesate prin utilitarul GeForce Experience, care face deja parte din pachetul de drivere grafice NVIDIA. Meniul conține o setare de calitate care setează rata de biți a videoclipului viitor. Opțiunile disponibile sunt 16, 23 sau 52 Mbps. Videoclipul de până acum este înregistrat doar într-o rezoluție - 1080p - și la 60 de cadre pe secundă. Indiferent de rezoluția la care rulează de fapt jocul, produsul final va fi scalat la acele setări. Sperăm că versiunea finală a ShadowPlay va avea o alegere de rezoluții cel puțin la fel de scăzute ca 1080p și chiar mai bine, până la 2560x1600 fără scalare. Dar deocamdată există.

    Scopul ideii ShadowPlay este că funcționarea utilitarului în același timp cu jocul are un efect redus asupra performanței jocului. Acest lucru se datorează parțial codificatorului hardware H.264, dar există un alt motiv: hardware-ul Kepler oferă posibilitatea de a citi direct conținutul buffer-ului de cadre, de care NVIDIA avea nevoie în primul rând pentru streaming de jocuri pe platforma cloud GeForce GRID, dar ca urmare, a găsit și aici o astfel de aplicație foarte locală. Cu toate acestea, nu se poate spune că înregistrarea video constantă în fundal în buffer cu ShadowPlay activat este complet gratuită.

    În trei jocuri din clipul nostru de testare, atunci când capturați o imagine la rata de biți maximă, rata de cadre scade cu 7-8% față de nivelul original. Și totuși, acest lucru este doar fleacuri în comparație cu ceea ce se întâmplă atunci când înregistrați un joc folosind metode pur software, ca să nu mai vorbim de consumul fulgerător de spațiu ROM atunci când produsul este salvat într-un format „raw”. În general, folosirea unui encoder în acest scop, pe care toate GPU-urile discrete îl au astăzi, pare o idee atât de evidentă și simplă, încât ne întrebăm de ce un fel de ShadowPlay nu a apărut mult mai devreme.

    ⇡ Construcții

    Sistem de răcire GeForce GTX 780 Ti in termeni generali nu diferă de acele modele care sunt instalate pe versiunea de bază a GTX 780 și GTX TITAN. Lipsa modificărilor în acest caz este pe deplin justificată, deoarece acest cooler este practic un exemplu de referință de „turbină” (sau suflantă) – foarte eficientă și în același timp silențioasă. Ei bine, pe lângă avantajele practice, o placă video grea într-o carcasă metalică este pur și simplu plăcută de luat.

    La sfârșitul carcasei, unde se află conectorii SLI, este decupată sigla GeForce GTX, evidențiată cu verde strălucitor.

    Cu toate acestea, coolerul GeForce GTX 780 Ti diferă de implementările anterioare într-un fel: radiatorul GPU, vizibil prin fereastra de plastic, este vopsit în negru, ceea ce face ca dispozitivul să arate mai sever.

    Apropo, acest radiator este mai compact în comparație cu ceea ce am văzut recent la Radeon R9 290/290X, dar are și o cameră de evaporare la bază. Radiatorul pentru cipurile de memorie și MOSFET-urile sistemului de alimentare este un cadru metalic masiv din aluminiu turnat sub presiune.

    Designul barei cu conectori a rămas același. Grila „de evacuare” a sistemului de răcire se împarte spațiu cu un singur slot cu un port DVI-D stângaci. În plus, placa are ieșiri DVI-I, versiuni full-size ale HDMI și DisplayPort.

    ⇡ Taxa

    GPU-ul GK100, lipit pe placa GeForce GTX 780 Ti, nu este doar un cip complet deblocat, ci aparține și versiunii de silicon B1, în care producătorul a remediat câteva erori minore și a redus ușor scurgerea de curent.

    Specificațiile cardului sunt îndeplinite de cipurile de memorie SK Hynix marcate H5GQ2H24AFR-R2C, care oferă o frecvență efectivă nominală de 7 GHz. Cipurile sunt concentrate doar pe suprafața frontală a PCB-ului, dar în spatele plăcii în poziții de oglindă sunt zone marcate pentru a doua serie de microcircuite.

    Se placă de circuit imprimat la prima vedere, exact la fel ca GeForce GTX TITAN și GTX 780, dar există totuși unele diferențe. NVIDIA a schimbat unele dintre elementele sistemului de alimentare cu alte analogi - probabil nu fără motiv. În general, adaptorul video este încă deservit conform schemei 6 + 2 + 1 (numărul de faze pentru GPU, cipuri de memorie și PLL). Tensiunea de pe procesor este controlată de același controler ON Semiconductor NCP 4206 PWM.

    NVIDIA a anunțat, de asemenea, o nouă caracteristică a sistemului de alimentare al lui GTX 780 Ti, imperceptibilă în timpul inspecției vizuale a plăcii - echilibrarea curentului pe trei surse, care sunt conectori de alimentare auxiliare cu șase și opt pini împreună cu un slot PCI-Express. Sarcina automatizării suplimentare este de a se asigura că în timpul overclockării nu există o astfel de situație când una dintre magistralele de alimentare este încărcată la maximum, în timp ce celelalte două se „odihnesc”.

    ⇡ Metodologia de testare

    Configurarea standului de testare
    CPU Intel Core i7-3960X la 4,6 GHz (100x46) Intel Core i7-3970X la 4,6 GHz (100x46)
    Placa de baza ASUS P9X79 Pro
    RAM DDR3 Kingston HyperX 4x2 GB @ 1600 MHz, 9-9-9
    ROM Intel SSD 520 240 GB
    unitate de putere Corsair AX1200i 1200W Seasonic Platinum-1000, 1000 W
    Răcire CPU Arconte termic
    Cadru CoolerMaster Test Bench V1.0
    sistem de operare Windows 7 Ultimate X64 Service Pack 1
    Software pentru carduri AMD AMD Catalyst 13.11 Beta
    v8 (pentru Radeon R9 290); v5 (pentru alții)
    + Profiluri de aplicare a catalizatorului 13.5 CAP1
    Software pentru carduri NVIDIA 331.70 (pentru GeForce GTX 780)
    331,58 WHQL (pentru alții)

    Pentru a măsura puterea sistemului, se folosește un suport cu o sursă de alimentare Corsair AX1200i. Tehnologiile CPU de economisire a energiei sunt dezactivate în toate testele. Autobuzul PCI-Express funcționează în modul 3.0. Pentru a activa PCI-E 3.0 pe plăcile video din seriile GeForce 600 și 700 într-un sistem bazat pe chipset-ul X79, se aplică un patch de la NVIDIA.

    În setările driverului NVIDIA, procesorul este întotdeauna selectat ca procesor pentru calculul PhysX. În setările AMD, setarea Tesselation este întotdeauna mutată din starea AMD Optimized la Utilizați setările aplicației.

    Un set de repere
    Program API Setări Filtrare anizotropă, anti-aliasing pe tot ecranul Permisiune
    3D Mark 2011 DirectX 11 Profil Extrem - -
    3DMark DirectX 11 Test de lovire de foc (nu extrem) - -
    Unigine Heaven 2 DirectX 11 DirectX 11 max. calitate, teselație în modul Extreme AF 16x, MSAA 4x 1920x1080 / 2560x1440
    Crysis Warhead + Framebuffer Crysis Warhead Benchmarking Tool DirectX 10 DirectX 10 max. calitate. Frost flythrough demonstrație AF 16x, MSAA 4x 1920x1080 / 2560x1440
    Battlefield 3 + FRPS DirectX 11 Max. calitate. Începutul misiunii Going Hunting AF 16x, MSAA 4x + FXAA 1920x1080 / 2560x1440
    Batman: Arkham City. Benchmark încorporat DirectX 11 Max. calitate AF, MSAA 4x 1920x1080 / 2560x1440
    Confruntare DiRT. Benchmark încorporat DirectX 11 Max. calitate, Iluminare globală incl. Pista Shibuya, 8 mașini AF, AA 4x 1920x1080 / 2560x1440
    Far Cry 3 + FRPS DirectX 11 DirectX 11 max. calitate, HDAO. Începutul misiunii Secure the Outpost AF, MSAA 4x 1920x1080 / 2560x1440
    Tomb Raider. Benchmark încorporat DirectX 11 Max. calitate AF 16x, SSAA 4x 1920x1080 / 2560x1440
    Bioshock infinit. Benchmark încorporat DirectX 11 Max. calitate. postprocesare: normală AF 16x, FXAA 1920x1080 / 2560x1440
    Crysis 3 + FRAPS DirectX 11 Max. calitate. Începutul misiunii Post Human AF 16x, MSAA 4x 1920x1080 / 2560x1440
    Metrou: Ultima lumină. Benchmark încorporat DirectX 11 Max. calitate AF 16x, SSAA 4x 1920x1080 / 2560x1440

    ⇡ Participanții la test

    Următoarele plăci video au participat la testarea performanței:

    ⇡ Overclocking, temperatura, consumul de energie

    În modul normal, GeForce GTX 780 Ti menține viteze de ceas destul de mari sub sarcină. În timpul testului Crysis 3, GPU-ul a funcționat la 1006-1020 MHz (nu mult mai mult decât GTX 780 și GTX TITAN) cu scăderi ocazionale la 993 MHz. În același timp, tensiunea maximă pe GPU a fost de 1.187 V, în timp ce GTX 780 și GTX TITAN se mulțumesc cu 1.162 V.

    Dacă comparăm GTX 780 Ti cu Radeon R9 290X, atunci se dovedește că ambele plăci video (presupunând că R9 290X rulează în modul Uber cu o viteză mai mare a ventilatorului) păstrează stabil frecvența în jur de 1 GHz sub sarcină.

    Dar procesorul GK110 menține în același timp o temperatură de 83 ° C, iar rotorul sistemului său de răcire se rotește până la 2336 rpm, iar Hawaii se încălzește până la 93 ° C, în timp ce răcitorul se rotește la o viteză de 2727 rpm.

    E amuzant, dar judecând după testul din Crysis 3, GeForce GTX 780 Ti este ușor superioară Radeon R9 290X în ceea ce privește consumul maxim de energie, iar sistemele de răcire ale rivalilor arată la fel ca putere, dar R9 290X clar are probleme cu disiparea căldurii. Poate că motivul este diferitele zone cristaline ale lui GK110 și Hawaii: prima are 533 mm 2, iar a doua are 455 mm 2, de unde densitatea diferită a fluxului de căldură.

    În plus, trebuie remarcat faptul că sistemul de răcire al lui GTX 780 Ti este bun nu numai pentru designul său rafinat și inscripția luminoasă, ci și pentru caracteristicile sale acustice excelente. Chiar și la 4261 rpm, care este maximul pentru rotor, zgomotul nu poate fi comparat cu vuietul răcitorului Radeon R9 290X de serie la aceeași viteză. În plus, spectrul de zgomot al NVIDIA este mai moale și mai plăcut la ureche.

    În ceea ce privește capacitățile de overclocking, GeForce GTX 780 Ti este inferioară versiunii „vanilie” a lui GTX 780, ceea ce este destul de așteptat, având în vedere disiparea suplimentară a căldurii de la cele trei SMX-uri latente anterior și tensiunea crescută pe GPU. În plus, noul flagship are o marjă TDP slabă - poate fi mărită doar cu 6%. Pentru orice eventualitate, prin rularea ventilatorului la viteză maximă, astfel încât temperatura să nu afecteze dinamica frecvenței și prioritizarea temperaturii în EVGA Precision, am reușit să creștem frecvența de bază la 986 MHz, iar valoarea maximă înregistrată a crescut la 1130 MHz. Frecvența sub sarcină este destul de stabilă - în timpul testului în Crysis 3, nu a scăzut sub 1111 MHz.

    Judecând după starea indicatorilor Power/Voltage/OV/Utilization Limit, pe care NVIDIA i-a furnizat plăcilor video cu tehnologie GPU Boost 2.0, limita consumului de energie și, în același timp, tensiunea GPU-ului devin un obstacol în calea overclockării plăcii video. Încercările de a transforma opțiunea Supratensiune pur și simplu nu au dus la nimic: creșterea de tensiune specificată cu 75 mV nu a fost înregistrată pe grafice.

    Ceas de bază, MHzMax. Boost Clock, MHzCeas de bază, MHz (overclockare)Max. Boost Clock înregistrat,
    MHz (overclockare)
    GeForce GTX 780 Ti 876 1020 (+144) 986 1130 (+144)
    GeForce GTX TITAN 836 1006 (+145) 966 1150 (+184)
    GeForce GTX 780 863 1006 (+143) 1053 1215 (+162)

    Performanță: repere sintetice

    • În acest test, GeForce GTX 780 Ti este previzibil mai rapid decât toate plăcile video cu un singur procesor și chiar depășește GeForce GTX 690 în parametrul 3DMark Score.

    • Dar într-o versiune mai recentă a benchmark-ului, rezultatele GeForce GTX 780 Ti sunt surprinzător exact aceleași cu ceea ce a obținut Radeon R9 290X.
    • Încă o dată, GTX 780 Ti a obținut un scor mai mare decât GTX 690.

    Unigine Heaven 2

    • GTX 780 Ti atinge călcâiele ambelor plăci grafice dual-GPU.
    • Diferența dintre GTX 780 Ti și Radeon R9 290X este destul de mare. Datorită procesării rapide a geometriei, care este mai importantă decât orice altceva în acest test, bogată în teslare hardware.

    Crysis 3

    • Dintre cele două plăci grafice - GeForce GTX 780 Ti și Radeon R9 290X - prima este mai rapidă și cu mult.
    • De fapt, GTX 780 Ti se apropie de pozițiile Radeon HD 7990.

    Metrou: Ultima lumină

    • Radeon R9 290X rezistă cu încredere, pierzând nu mai mult de 1 FPS în fața adversarului său.
    • GeForce GTX 780 Ti în sine este aproape egal cu GeForce GTX 690.

    ⇡ Performanță: overclocking

    Overclockarea GeForce GTX 780 Ti are un efect notabil asupra scorurilor la testele sintetice 3DMark, dar în jocuri creșterea frecvenței nu contează prea mult. Ne place sau nu, overclockarea unui GPU NVIDIA cu tehnologia GPU Boost nu este un exercițiu foarte fructuos. Mai mult, GTX 780 Ti este foarte limitat de TDP și nu oferă o oportunitate de a crește tensiunea de alimentare, ca urmare, creșterea frecvenței nu a fost la fel de mare ca în cazul GeForce GTX 780 din versiunea de bază.

    ⇡ Teste de joc + Unigine Heaven 2

    ⇡ Concluzii

    În intervalul de prețuri de la 400 la 550 USD ocupat în mod normal de plăcile grafice de jocuri pasionate, AMD este mai puternic ca niciodată. De fapt, pentru prima dată în istoria confruntării dintre cei doi principali producători de GPU-uri discrete, adaptoarele video AMD nu numai că nu sunt inferioare concurenților de cost egal oferiți de NVIDIA, dar chiar îi depășesc vizibil în performanță. Dar NVIDIA avea în rezervă o armă secretă - un GPU GK110 complet deblocat. În timp ce GeForce GTX 780 nu poate fi făcută suficient de ieftină pentru a oferi aceeași performanță pentru 400 USD (cât costă Radeon R9 290), Verzii sunt capabili să creeze o placă grafică mult mai scumpă decât Radeon R9 290X, dar îl depășește fără echivoc pe cel din urmă în performanță.

    Doar că GK110 a avut inițial o marjă de scalare până la înălțimile pe care GeForce GTX 780 Ti le-a demonstrat astăzi, iar GPU-ul Hawaii din Radeon R9 290X și-a arătat deja întregul potențial. În primul rând, desigur, GK110 include cu un miliard de tranzistori mai mulți decât Hawaii. Dar, nu mai puțin important, NVIDIA a gestionat altfel acest buget. AMD a investit într-o mulțime de ROP-uri, făcând R9 290X mai capabil de jocuri 4K, dar NVIDIA a pus mai mult accent pe unitățile de filtrare a texturii. Avantajul procesării geometriei este din nou de partea GPU-ului de top NVIDIA. După cum arată testele, la rezoluții de până la 2560x1440, ultimii parametri sunt încă mai importanți decât rata de umplere a pixelilor.

    În mod curios, GTX 780 Ti și Radeon R9 290X sunt foarte apropiate în ceea ce privește vitezele ceasului GPU-urile și, aparent, au aproximativ același consum de energie (cel puțin 280-290 W), ceea ce în sine vorbește în favoarea NVIDIA, deoarece GK110 este un cip mai complex și mai performant decât Hawaii. Dar cu toate acestea, placa video NVIDIA se încălzește și mai puțin. Nu putem să nu lăudăm coolerul de referință pe care GTX 780 Ti l-a moștenit de la predecesorii săi, dar în mod clar nu este vorba doar despre sistemul de răcire. Se pare că GK110 în sine este mai eficient în disiparea căldurii.

    Cu toate acestea, judecând din punct de vedere pur practic, GeForce GTX 780 Ti și Radeon R9 290X nu sunt concurenți direcți din cauza diferenței de preț de 150 USD. Noul flagship NVIDIA, ca și versiunea de bază a GTX 780 de mai devreme, s-a dovedit a fi singurul reprezentant al propriei categorii de preț pentru entuziaștii care sunt gata să plătească bani în plus peste 500-550 USD obișnuiți care constituie prețul de o placă video high-end. Ca atare, este puțin probabil să aibă o alternativă până când producția GPU-ului nu stăpânește tehnologia procesului de 20 nm.

    În sfârșit, să spunem câteva cuvinte despre GeForce GTX TITAN, care până acum a fost considerată cea mai productivă placă video cu un singur procesor de la NVIDIA. După lansarea GeForce GTX 780 Ti, acesta va continua să fie vândut și chiar nu au existat declarații oficiale despre o reducere de preț. Aparent, TITAN va costa în continuare 1.000 de dolari, dar acum este prezentat ca un adaptor video „prosumer” cu capacitatea de a efectua calcule non-grafice cu precizie dublă la 1/3 din viteza unui FP32. De fapt, un fel de analog al Quadro K6000 pentru non-profesori. Valoarea TITAN ca placă grafică pentru jocuri după lansarea GeForce GTX 780 Ti a fost complet distrusă.