Cinebench 11,5 – na hranici, s kacířem! Zhodnocení benchmarku z pohledu dneška...

18.2.2013· Autor: Pavel Zoch, Ph.D.· Počet komentářů: 2

Cinebench R11,5 je už dlouhá léta, však si sami vzpomeňte z jaké verze CINEMY 4D vychází, etalonem výkonu v 3D aplikacích. A to nikoliv jen pro samotnou CINEMU 4D, ale množství renderovacích farem výkon svých stanic dokumentuje právě tímto etalonem. Otázkou ale je, nakolik je dnes ještě relevantní. Kacířská myšlenka. Přesto, neodvolám... Průvodcem nám budou procesory AMD, zejména FX 8350 doprovázený Thubanem 1100 a dvěmi Opterony 6272.

Před časem jsem měl zajímavou příležitost, která se mi ještě doufejme zopakuje, dlouhodobě zkoušet výpočetní server postavený na starší generaci serverových procesorů AMD Opteron 6272 (Bulldozer) a srovnával jsem samozřejmě výsledky se starým přetaktovaným Thubanem s taktem 3,63 GHz, který jsem měl v té době na svém počítači (vyšlo v magazínu Pixel). Výsledky byly velmi zajímavé, pokusil jsem se totiž odpovědět na otázku, nakolik může být takový výpočetní stroj výhodný. A výhodný by byl, ostatně, cena AMD je postavena podstatně níže než v případě Intelu a za cenu dobré jednoprocesorové stanice se dá postavit dvou procesorový stroj s 64 GB na RAM, profi kartou FirePro (V4900), který má sice relativně nízký výkon per jádro (pracovní výkon v editoru), ale velmi dobý renderovací výkon a poměrně slušné provozní vlastnosti. Užití takové stanice by ale omezení de facto eliminovalo. Pamatoval jsem totiž stále na to, jaká situace například panuje v Newslabu, kde mimochodem pracuje dost mých bývalých studentů (http://www.newslab.cz/cz/).

Abych ideu popsal. Ve zmíněné společnosti, a určitě i jinde, bylo několik „operátorů“ (jsou určitě kreativnější než pozice, která se pod tímto označením skrývá, berte označení s rezervou) a tím pádem i licencí. Samozřejmě se dal využívat i Net Render, ale celkově vše bylo postavené tak, že pracovní stanice nebyly apriori těmi, které byly i stanicemi výpočetními. K tomu sloužil jeden mimo umístění PowerMac (stanice) s dvěmi procesory s mnoha jádry, na který se vše pouštělo pomocí Net Renderu. To bylo dost výhodné, protože většinou se samozřejmě nerenderovalo více zakázek najednou a tak pro „operátory“ stačily i méně výkonné stanice, mající jiné zaměření (lepší GPU pro rychlejší OpenGL, vyšší výkon per jedno jádro a podobně.

Ve svém testu jsem se tedy zaměřil na běžné užití stroje jako výpočetní stanice a přišel jsem na zajímavou věc, kterou ale šlo předpokládat. A to, že od doby R11,5 se toho opravdu hodně změnilo. A výkonostní poměry, které vyplývají z testu Cinebench R11,5 nejsou skoro vůbec podobné tomu, jaké výsledky dosáhneme, pokud použijeme modernější technologie, zejména fyzikální kameru+engine CINEMY 4D. Je evidentní, že nové technologie, lepší využití více jader a podobně do značné míry znevěrohodňuje celý Cinebench.

Dnešní článek ještě více rozvine danou úvahu, protože jsem se konečně dostal k tomu, abych vyzkoušel na své stanici novější procesor AMD s označením FX 8350 (daná řada je označovaná jako Pilledriver) poskytnutý pro tyto účely společností Asbis (děkuji za zápůjčku). Mimochodem, podle mého názoru vynikající procesor. Proč?

Vsuvka o procesoru FX 8350 a berte to jako předfilm :-)

Určitě si to ještě shrneme a omlouvám se za vsuvku. Článek ale také můžete brát součastně jako uživatelskou recenzi tohoto procesoru a to jakkoliv je dnešní článek o poněkud něčem jiném, z výsledků bude potenciál procesoru velmi dobře patrný. Podstatné kritérium, a to asi u všeho, je výkon/kontra cena. Nikdo netvrdí, že nejsou nové Intely i7 (IB) výkonnější, ale jsou také výrazně dražší a jejich výkon v případě zejména unbias řešení a OpenCL zdaleka neodpovídá vyšší ceně (proti AMD). V této oblasti, tedy tam kde se orpavdu využije potenciál 8 jader (nebo čtyř modulů, jak chcete) využije, si vede AMD opravdu velmi dobře. Článek doplníme o informace testů z webu, abychom si vše samozřejmě zdůvodnili. Mám tedy pocit, že AMD má v mainstreamu co nabídnout. Cena srovnatelná s i5 konkurence, ale výkon často atakuje i7 a při mírném přetaktování (což lze u levného řešení skoro očekávat) ji víceméně dorovnává. Jinými slovy, za relativně méně peněz dost muziky. Nevýhody těchto procesorů jsou podobné jako v případě Opteronů. Tedy primárně to, že je nižší výkon per jedno jádro. To se může odrazit na hrách (jakkoliv ty už více závisí na GPU), což pro nás není podstatné. Ani si nepamatuji kdy jsem hrál něco naposledy. Primární ale může být úroveň efektivity práce v editoru, kdy i5 může mít výkon na jedno jádro v CB (a jednu jádru v CB poměrně věřím) okolo 1,5-1,6 proti hodnotě 1,15, kterou mám u lehce přetaktovaného FX 8350. Pro zajímavost přikládám níže screen také výkonu Quadra 4000 při vyšší vyšším výkonu procesoru na jedno jádro proti staršímu Thubanu 1100 s taktem 3,63. Zvýšení výkonu na jedno jádro se projevilo také ve zrychlení Quadra, sice jen o 1 fps, ale zkoušel jsem test několikrát (a to kdysi i na Thubanu) a rychlost nikdy neklesla, jinými slovy, potvrzuje se to, že vyšší výkon jednoho jádra má vliv na rychlost zobrazení editoru.

cb

Jen pro úplnost, provoz FX 8350 není vůbec špatný, bez zátěže stroj běží (specifikace viz níže) na 120 W, při plné zátěži cca 300 W (4 minuty běžící Frybench). Starý Thuban si při stejné konfiguraci řekl o 100 W více. Poměrně dost si i bez zátěže bere Fermi Quadro 4000 (i bez zátěže je teplota cca 80-85 stupňů a něco to chladit musí), tekže celkově je pro mne reálné chování slušné. Pravda, Intel je v tomto smyslu s 22 nm technologií proti 32 AMD jednoznačně úspornější.

Konec předfilmu, začíná hlavní program

Testy:

Připravil jsem si pro vás tedy několik testů a pokud mohu, také několik informací z webu, které by vše měly doplnit (některé komparační testy jednoduše nemám na Thubanu zpracované a tak by nebylo srovnání relevantní).

K dispozici tedy máme následující:

Cinebench 11,5 Multithreading

Cinebench 11,5 Single core

Cinebench 11,5 OpenGL (pro zajímavost)

Scéna CINEMA 4D R14 fyzikání engine a efekt okolní prostředí

Scéna CINEMA 4D R14 fyzikání engine a efekt globální iluminace v režimu QMC+rad. maps

MentalRay, respektive Iray, unbias rendering (CPU pouze)

Frybench (Fryrender)

Článek bych rád doplnil o informace o dalších renderovacích systémech, zejména LuxMark (výsledek z Opteronů mám vlastní - Sala 647, Room 242, ostatní jsou z webu). A snad jen osobní zkušenost z porovnání Indigo rendereru při stejné GPU ale rozdíleném CPU na stejném počítači, jen jiném CPU (subjektivní, nikoliv exaktní, názor).

Obecně, článek se nesnaží být standardním testem hardware, ale spíše kritickým zamyšlením nad vypovídací hodnotou daného testovacího systému. Ostatně, stroj je v provozu rok a půl při stále stejné instalaci operačního systému, na pozadí běží množství drobných aplikací, které obhospodařují periferie (například grafický tablet Wacom, mikrofon, externí disk, UPS Eaton) a podobně... To také o něčem vypovídá.

Hardware

Thuban 1100 OC na 3,63 GHz

MB Asus CROSSHAIR V Formula - 990FX
CPU AMD Phenom II X6 1100T
RAM Patriot Viper II (Sector 5) 4x4GB DDR3 2000MHz (16GB)
Zdroj CORSAIR 750AX, 750W (Gold)
CASE CoolerMaster HAF 932
GPU NVidia Quadro 4000
Primární panel NEC PA 241W (displayport)
Sekundární panel EIZO FlexScan S1961 (DVI-D)
Systém Win 7 64 bit

2xOpteron 6272 2,1 GHz (Prestigio 4U GPU server)

MB: MBD-H8DGI-F-O - SUPERMICRO MB 2x Socket G34
CPU: 2x AMD Opteron 6272 (socket G34, 2.1 GHz, 16 jader)
Skříň: CSE-745TQ-R920B - SUPERMICRO Tower/4U,
RAM: 8x-Kingston 8 GB 1600 MHz DDR3
Grafická karta: FirePro V4900
Panel EIZO FlexScan S1961 (DVI-D)
Systém Win 7 64 bit

Pilledriver FX8350 OC na 4,4 GHz

MB Asus CROSSHAIR V Formula - 990FX
CPU AFX8350 4,4 GHz (nativně 4,0 GHz)
RAM Patriot Viper II (Sector 5) 4x4GB DDR3 2000MHz (16GB)
Zdroj CORSAIR 750AX, 750W (Gold)
CASE CoolerMaster HAF 932
GPU NVidia Quadro 4000
Primární panel NEC PA 241W (displayport)
Sekundární panel EIZO FlexScan S1961 (DVI-D)
Systém Win 7 64 bit

Cinebench 11,5

Cinebench, to je oč tu běží. Pro nás jsou níže uvedené hodnoty etalonem, zejména v oblasti MT, protože v SC je sice podle mého CB velmi přesný, ale srovnáváme nesrovnatelné. Primární je, ostatně to už víme, ukázat, že nové technologie mají odlišný výkonový poměr proti starším procesorům a více vláken tak může být vyšším přínosem, než se na první pohled zdá (míním tím nyní FX 8350, Opterony jsou zde jen pro zajímavost). Pokud by ty někoho zajímaly, doporučuji současné vydání magazínu Pixel (01/2013) kde jsou rozebrány podrobněji.

Výsledky:

Opteron 6272x multicores: 13,51 (1/13,51=0,074)
Opteron 6272x single core: 0,72

Thuban 1100 3,63 GHz multicore: 6,37 (1/6,37= 0,157)
Thuban 1100 3,63 GHz single core: 1,09¨

FX 8350 4,4 GHz multicore: 7,52 (1/7,52=0,133)
FX 8350 4,4 GHz single core: 1,15

Co si z výsledků odnést? Jelikož se jedná o etalon, tak jen poměry. A v tomto smětu poměry rychlosti, tedy musíme si vše převést. Celkový nejdelší čas je 100%, což je výsledek přetaktovaného Thubanu. Další dva jsou rychlejší a proto je čas kratší – nižší je i hodnota procentuální.

Pokud je tedy výsledek Thubanu 100% (nejdelší čas), pak je:

Thuban 1100: 100%
Zrychlení proti referenci: 0%

FX 8350: 84,7
Zrychlení proti referenci:15,3 %

2xOpterony 6272 47,1%
Zrychlení proti referenci: 52,9 %

Zkusme si tyto hodnoty zapamatovat, nadále budeme už rovnou porovnávat časy a určitě bude zajímavé porovnávat jendotlivé řádky

CINEMA 4D R14, fyzikální engine, efekt AO, adaptivní výpočet

Opteron 6272x2: 00:09:15 (545 s)

FX 8350 4,4 GHz: 00:16:18 (978)

Thuban 1100 3,63 GHz: 00:23:39 (1419 s)

Thuban 1100: 100%
Zrychlení proti referenci: 0%

FX 8350: 68,9
Zrychlení proti referenci: 31,1 %

2xOpterony 6272 38,4
Zrychlení proti referenci: 61,6%

Všimněte si, pokud byl FX 8350 s maximálním taktem 4,4 rychlejší v CB 11,5 o cca 15%, tedy namísto aby se něco počítalo 100 vteřin by se úloha počítala 85 vteřin, pak v případě tohoto testu, použité technologie a scény je poměr odlišný. Namísto oněch 85% (a nebo vteřin jako v příkladu) by se úloha počítala cca 69 vteřin, tedy zrychlení je proti výsledku CB FX 8350 o 16%! Celkově o 31%! A to není vůbec málo!

Velmi podobný výsledek se udál v případě Opteronů. I když není rozdíl až tak dramatický (délka výpočtu 47,1% v CB, 38,4% v příkladu). Je tomu tak možná proto, že Bulldozery měly nižší hodnotu násobení výkonu per jádro (jádra Vishera – tedy Pilledrivery mají tuto hodntou vyšší a tím pádem lze předpokládat vyšší účinnost i MT výpočtů). Přesto i zde lze pochybovat o vypovídací hodnotě CB v případě fyz. engine CINEMY 4D.

ao

01

CINEMA 4D R14, fyzikální engine + QMC + radiosity maps

Thuban 1100 3,63 GHz: 00:12:14 (734 s)

FX 8350 4,4 GHz: 00:08:32 (512 s)

Opteron 6272x2: 00:04:57 (297 s)

Thuban 1100: 100%
Zrychlení proti referenci: 0%

FX 8350: 69,75%
Zrychlení proti referenci: 30,25 %

2xOpterony 6272: 40,46%
Zrychlení proti referenci: 59,54 %

A budeme se opakovat, protože výsledek jako by z oka vypadl příkladu s efektem AO. Otázkou je, zda není mírně nižší poměr dán tím, že je tento výpočet přeci jen v jistém smyslu rozškálován na více postupně zpracovávaných úloh (spekulace), tedy qmc, mapy radiozity, fyz. engine. Jinak jsou výsledky velmi podobné. FX 8350 s taktem 4,4 GHz zkrátil čas proti referenčnímu Thubanu o 30 % (proti 15 v CB). Výsledek je tedy opravdu velmi podobný jako v předchozím případě.

A Opterony? Podobné, nedosáhly sice hodnoty pod 40% původního referenčního času, ale cca 40,5 je opět velmi blízko. Zdá se, že fyz. engine má opravdu své vlastní poměry výkonnů...

01

01

Iray (Mental Ray) for CINEMA 4D

Thuban 1100 3,63 GHz: 00:06:44 (404 s)

FX 8350 4,4 GHz: 00:05:56 (356 s)

Opteron 6272x2: 00:03:08 (188 s)

Thuban 1100: 100% 0
Zrychlení proti referenci: 0%

FX 8350: 88,1%
Zrychlení proti referenci:  11,9%

2xOpterony 6272: 46,5%
Zrychlení proti referenci:  53,5%

Iray je tuším první unbias engine na GPU a určitě první který uměl kombinovat výkon CPU+GPU. Má to ale své stinné stránky. Mezi jinými to, že je to v jádře poměrně stará technologie a není (prý) ideálně optimalizovaná pro dnešní CPU. Co na to náš test?

Výsledek je velmi zajímavý a vlastně se (zhruba, nikoliv zcela přesně) kryje s výsledkem, který nám poskytla scéna v Cinebench 11,5. mou osobní spekulací je, že je to dáno právě datem zrození jádra Iraye. Jakkoliv si myslím, že je Iray opravdu skvěle skrze Mental Ray implementován.

iray

01

Frybench

Opteron 6272x2: 00:02:45 (165 s)

Thuban 1100 3,63 GHz: 00:07:00 (420 s)

FX 8350 4,4 GHz: 00:04:52 (292 s)

Thuban 1100 100%
Zrychlení proti referenci: 0

FX 8350 69,5%
Zrychlení proti referenci: 30,5

2xOpterony 6272 39,3%
Zrychlení proti referenci: 61,7%

Frybench, což je vlastně benchmark vzniklý z Fryrendereru, dnes zmutovaného do hybridního Arionu. Ve své době ale byl Fryrender spolu s Maxwellem (ten jako první) průkopníky v oblasti Unbias řešení a dodnes je bráno rozhraní Arionu jako jedno z nejlepších. Žel Arion šel zvláštní cestou, kdy ostatní se snaží o co nejširší porty, Arion si vybral dva produkty Autodesku a snad i Rhino a to je zatím vše.

Zpět k testu. Test jsem odečítal nikoliv jako celkový výpočet, ale výpočet po „warmingu“ (což je samotný test). Obecně vzato ale uživatele zajímá i doba exportu scény, i když je pravda, že čím je scéna komplexnější a zabere v unbias více času, tím menší vliv tento „export“ má. Na druhou stranu se v něm projevuje případně nižší výkon per jádro.

Ale, Randomcontrol unbias prostě umí a tak se zdá, že i Fry uměl vytáhnout z CPU jeho potenciál. A výsledek? Podobné poměry, vlastně shodné, jaké jsou v případě fyzikálního enginu CINEMY 4D.

FX8350 zkrátil čas z etalonu o 30,5% (v případě fyzikálního enginu CINEMY 4D to bylo 30,25 % a 31,1 % ), dva opterony odečetly dokonce 61,7%, což je opět podobné jaké v případě C4D phy. enginu (61,6 a 59,54).

fry

fry

Závěrem šetření

Tři rendery ze CINEMY 4D, respektive jeden z Cinebenche 11,5 a dva z CINEMY 4D R14 s využitím phy. enginu a efektů globální iluminace (QMC + rad. maps) a druhý s efektem okolní prostředí. Dva unbias systémy, jeden technicky starší, průkopnický, druhý ve vrcholu před změnou strategie. Výsledek šetření je podle mého docela jasný.

Pokud používáte fyzikální engine, a musím přiznat že vlastně jiný osobně nepoužívám (standardní engine používám jen v případě speciálních simulací (Hair) a nebo požadavků), pak není výsledek Cinebenche 11,5 vůbec relevantní. Zdá se mi, že pokud bychom se řídili spíše výsledky Frybenche, měli bychom podstatně relevantnější data.

Pojďme se tedy podívat na výsledky Frybenche z našich českých luhů a hájů.

Z pohledu FX 8350

Pokud mohu, vypůjčíme si výsledky ze serveru www.extrahardware.cz. Zde před několika týdny vyšla recenze na i7 3770 a mimo jiné zde najdeme i mou osobou použitý FX 8350, máme tedy srování. Jen podotýkám, délky času (ve vteřinách) jsou v případě Fry určitě bez warmingu (čistý výpočet).

Odkaz je zde:

http://extrahardware.cnews.cz/clanky/core-i7-3770k-nove-metodice-vyplati-se-priplatek-oproti-i5/strana/0/3

Pokud odsouhlasíme, že Frybench je výkonnostně podstatně bližší samotné CINEMĚ 4D fyzikálnímu enginu, pak FX 8350 vychází dalece před cenově konkurenční i5 a atakuje (velmi blízce) i7 3820 i i7 3770. V případě mém, při přetaktování na 4,4 GHz je již rozdíl proti zmíněným nepřetaktovaným i7 minimální, ba se vměstná mezi ně (292 vteřin pro FX 8350 s 4,4 GHz kontra i7 3820 s 304 sekundami a i7 3770 s 281 sekundami). Tím samozřejmě netvrdím, že nelze i7 přetaktovat. Naznačit chci pouze, že potenciál procesoru, v tomto případě AMD FX 8350, může být v konkrétním případě zcela odlišný od toho, co jeden benchmark (Cinebench), a to i přesto že je i mně osobně tak blízký, říká...

Mimochodem, ani v OpenCL si nevede toto AMD vůbec špatně... A když jsme u toho, zcela subjektivně mám pocit, že podobné zrychlení, jaké dává tušit FryRender poskytuje i Indigo renderer, bohužel jsem neměl scénu, se kterou bych mohl vše komparovat (respektive měl, ale nomohu ji publikovat).

Celkový závěr

Pokud si porovnám data která jsem si postupně sebral, a uznávám že to jsou data pohříchu pouze z procesorů AMD (mám podobná i na i7 3610QM, ale porovnávat tento mobilní segment s desktopem jednoduše nejde), musíme se při koupi hardware vždy zaměřit na to, co budeme vlastně používat a jakého stáří daná technologie je. Cinebench 11,5 vycházející z CINEMY R11,5 je toho jednoznačně důkazem. Z pohledu R11,5 FX 8350 nevychází zle, ale není to převratné, v unbias opencl (viz odkaz), fyzikální engine CINEMY 4D je ale situace dosti odlišná.

Jsem špatným evangelistou. Ale jsem upřímný k uživatelům. Pro mne osobně má Frybench větší vypovídací hodnotu než Cinebench 11,5. Ten je relevantní (ale také ne zcela, protože i v oblasti standardního enginu jsou již implementované optimalizace, které pracují pro vyšší počet jader a podobně) jen pro standardní engine.

Pavel Zoch, Ph.D. Úplnej a naprostej .....

E-mail: pzdm(zavinac)digitalmedia.cz | Web: www.3dsoftware.cz | ICQ: 248707187 |

Motto: "Co ve věčnosti leží, mrtvé není, v záhadě věků i smrt se ve smrt změní." (H.P.L.)

Komentáře k článku  
wtf permonik | 4.3.2013 20:21
AMD pzdm | 6.3.2013 21:27

Přihlášení uživatele