Úvod
AMD RV790, snad nejdiskutovanější čip jaký kdy měl přijit na trh. Nedávno jsem se o něm zmiňoval v článku "RV790 ohlašuje příchod RV8XX s DirectX 11". Předpokládalo se, že se jím společnost AMD pochlubí 3. až 8. března 2009 na Hannoverském CeBITu, ale nestalo se tak.
Bariera mlčení AMD nebyla prolomena a výsledkem je další vlna spekulací. Jak jsme si u RV790 mohli zvyknout, Fuad Abazovic (Fudzilla) a Visionar (VR-Zone) stále jenom vymýšlí nesmysly a věří, že se možná trefí, ale měli by u toho trochu více uvažovat.
.
Jednou jde o čip naprosto identický s RV770, pouze na vyšším taktu a jindy zase o čip naprosto nový, který má i jiné rozložení vývodů, jednou je vyráběn 40nm výrobním procesem a jindy zase 55nm. Na počátku vždy stojí senzační zjištění od zdrojů blízkých xy a zpráva již letí světem, aby časem byla vytlačena zprávou protichůdnou.
Sázka na jistotu
TSMC již 20měsíců vyrábí 55nm výrobním procesem a lze jej považovat za dostatečně stabilní a odladěný. AMD již 9měsíců vyrábí RV770, lze rovněž mluvit o dostatečně zvládnuté a zaběhnuté výrobě.
Dalo by se předpokládat, že AMD vsadí na jistotu a vytěží z 55nm výrobního procesu maximum. Levnější výrobní proces 55GP, kterým je vyráběno RV770 může nahradit dražším výrobním procesem 55GC a jít na vyšší takty.
.
Sázka na hrubý výkon
AMD již ukázalo, že při výrobě GPU umí a nespokojí se změnou výrobního procesu a ziskem výkonu založeném pouze na taktu, obzvláště, když výše taktované GPU jsou od samotného počátku.
Nahánět se za speciálně upravenými ovladači pro konkrétní hru v DX9, jak to v současné době dělá konkurence, si myslím, že vůbec nemá AMD zapotřebí. Jediné co má smysl, tak makat na výkonu uplatnitelném v DX11 a Tessallaci.
Přidáním dalších 160÷200 stream procesorů jich získá zcela nové GPU celkem 960÷1000 (12*16*5, 10*20*5), výkon při taktu 850÷900MHz dosáhne k úrovni 1,7TFlop/s.Útok na dvojitou přesnost
Právě zde bych viděl největší prostor pro zlepšení, již tak velmi dobrého RV770, které má výkon 1,2TFlop/s a ve výpočtech s dvojitou přesností 240GFlop/s, což je trojnásobek výkonu konkurence, ale pouze 20% hrubého výpočetního výkonu.
20% hrubého výpočetního výkonu, AMD se jistě pokusí tento stav ještě zlepšit a dosáhnout ve výpočtech s dvojitou přesností až na dvojnásobek, tedy na 40% hrubého výpočetního výkonu. Výsledný výkon ve výpočtech s dvojitou přesností by mohl dosáhnout až na 680GFlop/s (1,7*40%=680).
Další krok k Fusionu
Společnost AMD vytvořila vizi AMD Fusion, kde by měla GPU sloužit jako koprocesor či akcelerátor CPU. V cestě k Fusionu stála velmi dlouhá cesta k DirectX 11 a OpenCL 1.0, kde DirectX 11 se zaměřuje více na zpracování realtime 3D grafiky a OpenCL 1.0 na akceleraci výpočtů pomocí GPU.
Právě zde by se měl v budoucnosti sehrát největší boj o zákazníka, nejenom s GPU, ale rovněž s CPU. Často však půjde o symbiózu GPU a CPU a to nejenom pokud budou oba čipy v jednom pouzdře či dokonce na jenom čipu.
.
AMD má pro grafické procesory ATI Stream SDK a pro procesory instrukční soubor SSE5, na kterém se společnost Intel odmítla podílet. Většina čtenářů stale a striktně odděluje grafickou kartu, která slouží nejčastěji pro zpracování realtime 3D grafiky a využití grafické karty pro akceleraci výpočtů pomocí GPU. Budoucnost je však v současném využití obou funkcí GPU!
ATI Stream SDK v1.4
Společnost AMD se vrátila v listopadu loňského roku zpět k Stream technologiím, nyní zveřejnila ATI Stream SDK v1.4(beta).
.
Stream SDK, které přineslo řadu významných zlepšení pro Brook +, byla přidána podpora běžných X2 grafických karet, ATI Radeon HD 3870X2 a ATI Radeon HD 4870X2, stejně jak podpora profesionálních grafických karet ATI FirePro 3D V8750, V8770, V7770, V7750, V5700, V3750 a mnohé další.
.
Nástup GPU-CPU serverů
Právě konkurenční společnost Nvidia se značnou měrou zasadila o propagaci serverů postavených na bázi GPU-CPU počítání. Samotná Nvidia nebyla první, ale masívním a vytrvalým marketingem vytvořila dojem, že Nvidia CUDA je spasitelem a Nvidia TESLA je nejvýkonnější stroj světa.
Grafický procesor RV790 by mohl mít tak vynikající vlastnosti, že by jedna grafická karta postavená jako X2 mohla překonat konkurenci o celý řád a ne o nějakých pár %, hrubý výpočetní výkon daleko za hranicí 3,0TFlop/s a ve výpočtech s dvojitou přesností daleko za 1,0TFlop/s!
.
To co se nepodařilo prosadit v Coloradu s grafickými koprocesory společnosti SRC Computers, ani společnosti GPU-Tech, stejně jak se speciálními koprocesory společnosti DRC Computer Corporation, prosadila až masívní marketingovou kampaní společnost Nvidia se svou technologii CUDA a strojem TESLA.
V podstatě není velkého rozdílu mezi technologiemi Nvidia CUDA a ATI Stream, hlavní rozdíl vzniká až při užití těchto technologii zákazníky, kdo bude blíže OpenCL a DX11 má výhodu, kdo má navíc výrazně větší výkon má vyhráno.
.
Závěr
Přestože text pro mnohé vypadá jako samozřejmost vývoje GPU, pro jiné může působit jako nepochopitelné sci-fi. Grafický procesor RV790 je stále velkou neznámou a jeho specifikace vznikly jako kombinace znalostí a spekulací na dané téma, nakolik se spekulace potkají s realitou, či nikoliv se dozvíme 6. dubna 2009, kdy možná bude RV790 oficiálně uveden.
Stále však není zavržen ani 40nm výrobní proces, kde by mohla RV790 vypadat podobně jako dvojice RV740. Velikost čipu by se téměř nezvětšila, čip by měl sběrnicí 256bit (2*128) a počet strem procesorů 1280 (2x640), každá část by měla vlastní napájení, čímž by se dalo dosáhnout lepší regulace výkonu a tím i lepších tepelných vlastností...
AMD zatím oficiálně neprozradilo ani název čipu, ani název potenciální grafické karty, načež tak jakékoliv bližší specifikace výkonů apod.. Když se podívám na RV790 do Gogolu, tak se tam nejčastěji vyskytuje slovo Apríl!
Zdroj: Stanford University Graphics Lab pdf., ETNA Kent State University pdf., Tesla GPU Computing – NVIDIA & AMAX pdf., ATI Stream SDK User Guide (v1.4-beta) pdf., ATI Stream Software Development Kit (SDK)
Rubriky
L
Nejnovější
- HQQF 2 x 510-514 v jedné skříni
- HQQF 2párová levná verze
- Audio - Koronavirus a pětašedesátníci
- Genealogy of the genus Federmann
- Bastlírna - všeuměl Team boss EKKAR, nyní As vs. Ws
- Novinky Hi-Fi světa 09/2019
- Transiwatt pod palbou Trolů podruhé
- Transiwatt pod palbou Trolů
- Federmannovo zkreslení
- I MISTŘI se mýlí, aneb 50let slepé cesty po desíti letech
- Ochrana zesilovače
- Bastlírna - všeuměl Team boss EKKAR PC a step down
- Bastlírna - všeuměl Team boss EKKAR PC expertem
- Bastlírna - všeuměl Team boss EKKAR Lingvistou
- Bastlírna - všeuměl Team boss EKKAR trapně perlí
- Bastlírna - všeuměl Team boss EKKAR a Curieova teplota (Tc)
- Ceník zesilovačů III. tisíciletí, zesilovačů HQQF (únor 2019)
- Bezpečnostní rizika v Česku, aneb konec volné soutěže
- Bastlírna a všeuměl Team boss EKKAR stále perlí ...
- Závěrečný 23. článek v Praktické elektronice AR 12/2018
- Již 22. článek v Praktické elektronice AR 11/2018
- 7nm AMD finišuje v TSMC, Intel stále v nedohlednu
- Moduly a díly audio-zesilovačů
- Již 21. článek v Praktické elektronice AR 10/2018
- Jubilejní 20. článek v Praktické elektronice AR 09/2018
- Horko a Team boss EKKAR opět na EB radí
- 19. článek v Praktické elektronice AR 08/2018
- 18. článek v Praktické elektronice AR 07/2018
- Topologie Federmann opět hýbe internetem?
- 17. článek v Praktické elektronice AR 06/2018
- Rébus s ECC81 a opět EKKAR
- Ceník zesilovačů III. tisíciletí, zesilovačů HQQF
- USA odstupují od jaderné dohody s Íránem, světová ekonomika se otřásá v základech!
- 16. článek v Praktické elektronice AR 05/2018
- 15. článek v Praktické elektronice AR 04/2018
- 14. článek v Praktické elektronice AR 03/2018
- Internetové reakce na PE-AR květen 2018, EKKAR stále ve střehu
- NOVIČOK a konspirace?
- Petro-Yuan přichází, konec hegemonie dolaru?
- Elektronkový předzesilovač HQQF-55-510 opět trochu jinak
- Předzesilovače a charakteristiky RIAA stále dokonaleji a stále jinak
- RIAA dnešních dnů vs. Actidamp, EKKARovy rady nadevše
- Je všechno jenom náhoda?
- 13. jubilejní článek v Praktické elektronice AR 02/2018
- Malé ohlédnutí nejen za rokem 2017...
- 12. výroční článek v Praktické elektronice AR 01/2018, PF 2018
- DIN stále žije
- 11. článek v Praktické elektronice AR 12/2017
- Bastlírna opět ve starých kolejích a všeuměl EKKAR opět perlí
- 10. článek v Praktické elektronice AR 11/2017
- Cena Bastlířů 2017 - Vyhodnocení komentuje EKKAR
- 8. článek v Praktické elektronice AR 09/2017
- 9. článek v Praktické elektronice AR 10/2017
- 7. článek v Praktické elektronice AR 08/2017
- Výroba tranzistorů v ČSSR podle EKKARa
- 6. článek v Praktické elektronice AR 07/2017 a co dál?
- Měření FFT, pokořena hranice -300dB!
- 6. článek v Praktické elektronice AR 07/2017
- Proudová ochrana audio zesilovače
- Výroba elektronek v ČSSR podle EKKARa