PC Press
O nama
O nama
Pretplata
O nama
Postanite saradnik PC-ja
Kontakt sa redakcijom
PC Press
Novi broj
Novi broj   
Pretrazivanje
Arhiva
Arhiva   
PC Online
PC Plus   
Specijalna izdanja
Hardver Hardver
PC #22 : Mart 1997 TehnoGuru

 Naslovna  Sadržaj 
Bojan Tepavčević  

(Ne)dostižni Pentium

Prisustvo Pentium kompatibilnih procesora alternativnih proizvođača neminovno postavlja pitanje njihovih performansi u odnosu na original. Bojana Tepavčevića najviše je interesovala numerika.

Prisustvo Pentium kompatibilnih procesora alternativnih proizvođača neminovno postavlja pitanje njihovih performansi u odnosu na original, i to u što širem opsegu današnjih primena računara. Ovaj test je pokušaj da se upoređivanjem Intel, Cyrix i AMD procesora pokaže za koje je segmente primene računara princip označavanja koji koriste AMD i Cyrix tačan, a za koje nije, sa posebnim osvrtom na odnos performanse/cena. Naime, AMD K5 i Cyrix 6x86 procesori su po pravilu nešto jeftiniji od Intel Pentium-a na istoj (ili sličnoj) frekvenciji, a znatno jeftiniji od odgovarajućeg jačeg Pentium-a, u odnosu na koga su deklarisani kao jednaki ili brži.

Uz slabiji FPU?

Opšte je poznato (čak ni proizvođači to ne kriju) da AMD i Cyrix procesori imaju nešto slabije koprocesorske (FPU) jedinice, na uštrb čega je ubrzan njihov celobrojni (CPU) segment. Obzirom da je za najveći broj primena angažovana isključivo celobrojna jedinica, ovakva strategija bi morala dati dobre rezultate, naročito u slučaju Cyrix-a koji ima duplo veći prvostepeni procesorski (L1) keš od 16 KB. Čak i u slučaju aplikacija koje (makar i u nezanemarljivoj meri) koriste koprocesor, ukupne performanse bi morale biti bolje, obzirom da se i kod njih veći deo vremena provodi u izvršavanju "celobrojnih" mašinskih instrukcija.

Originalni Pentium bi, u skladu s tim, trebalo da bude bolji jedino u slučajevima intenzivne ("teške") numerike, kao što su operacije sa matricama, sistemi linearnih jednačina ili, uopšte uzev, kod onih primena kod kojih se određeni matematički problemi rešavaju u većem broju iteracija kao i kod Render/Shade procedura u okviru CAD aplikacija. S druge strane, takve primene mogu da oduzmu neuporedivo više vremena od onih kod kojih je težiše na celobrojnom radu gde je, sem kod sortiranja, teško pronaći program koji bi i izdaleka radio toliko dugo. Pretežni cilj nam je bio da ustanovimo koliko su ove pretpostavke tačne.

Kako smo testirali

Testirano je ukupno 10 procesora: Intel Pentium na 100, 133, 166 i 200 MHz, Pentium Pro na 166 i 200 MHz, AMD K5 PR100 i PR133 na 100MHz, Cyrix 6x86 P133+ (110MHz), kao i Cyrix 6x86 P166+ (133MHz). Kao platforma za testiranja korišćena je matična ploča Giga-Byte GA-586HX (GA-686NX za P6) sa 512 KB sekundarnog keša (radi upoređenja, jedan broj testova urađen je, pod istim uslovima sa P5/166 za matičnu ploču Biostar MB-8500TUC, takođe sa HX setom čipova i 512 KB L2 keša, koja je na testu objavljenom u 16. broju našeg časopisa bila najbolja), 64 MB RAM-a, ATI Mach64 Graphics Pro Trubo 4MB video kartom i WDC AC32500 2.5 GB hard diskom.

Pod DOS-om 7, Win95 i WinNT 3.51 Workstation testirana je: intenzivna numerika (Linpack), brzina komunikacije sa memorijom pri CPU INC i FPU FADD operacijama (R/W Troughput), render u 3D Studiju, Core 3.02, Norton NU8 SI i SI95, WinTach 1.3, Win Bench/Stone 96/97, BMACAD 2.0 pod AutoCAD-om 12, kao i test generisanja konstrukcije sa 80.000 stepeni slobode (StruAsm).

Brzina komunikacije

Na slici 1 nalaze se dijagrami brzine komunikacije procesora i koprocesora sa memorijom, u zavisnosti od veličine memorijskog bloka koji se intenzivno obrađuje. Odmah pada u oči da Pentium Pro apsolutno dominira, što se razlikuje od ranijih testova koje je autor obavio nad nekim od prvih Pentium Pro računara koji su se pre godinu dana pojavili kod nas. Tada je primećen slabiji rad FPU-a, što je rezultiralo lošijim rezultatima u FPU R/W Troughput-u i Linpack-u od P5/166. U međuvremenu su Pentium Pro procesori i matične ploče izlečeni od "dečijih bolesti", koje po pravilu prate svaku novu tehnologiju. Doduše, prema FADD-MFLOPS dijagramu očigledno je da se i dalje nešto čudno dešava dok je memorijski blok u okviru prvostepenog (L1) keša od 8 KB, ali ovoga puta uz ukupno znatno bolje rezultate nego ranije. U slučaju običnih Pentium-a, pokazala se kao tačna pretpostavka da klonovi rade brže od originala na CPU, a sporije na FPU operacijama. Pri tome Cyrix 6x86 više odskače od AMD-a K5, u odnosu na Intel P5 kao etalon, kako u pozitivnom (CPU) tako i u negativnom (FPU) smislu.

Na testu brzine komunikacije procesora sa memorijom, kada memorijski blok koji se intenzivno obrađuje pređe veličinu L1 keša pri CPU INC operaciji, Cyrix i AMD imaju manji pad u brzini od Intel-a. U okviru L1 keša K5 PR100 i PR133 postižu gotovo isti CPU troughput, veći od P5/133. Cyrix 6x86 P133+ ima veći troughput od P5/166, dok 6x86 P166+ postiže više čak i od P5/200.

U okviru L2 keša od 512 KB, K5 PR100 na blokovima preko 128 KB ostvaruje manje od P5/100, PR133 od P5/133, dok Cyrix-i imaju bolji troughput od P5/200! Pošto je dijagram teško čitljiv za memorijske blokove veće od L2 keša, odgovarajući rezultati su prikazani na slici 2. Vidi se da, kada se intenzivno obrađuje veliki memorijski blok (tada keš ne može mnogo da pomogne), CPU troughput AMD-a K5 PR100 i Cyrix-a 6x86 P133+ padaju na začelje. Za Cyrix je to i očekivano, pošto u njegovom slučaju memorija i ostala elektronika na ploči radi na nižoj frekvenciji od ostalih procesora. Za razliku od njih i 6x86 P166+ i K5 PR133 postižu više od P5/200. Interesantno je da svi Pentium-i (100-200 MHz), postižu slične rezultate (62.7-63 MB/s), što takođe pokazuje da AMD i Cyrix rade brže sa memorijom.

U slučaju FPU FADD R/W troughput-a, Cyrix je inferioran u odnosu na Intel-ove procesore, dok su oba AMD-a prestigla tek P5/100. Oba AMD-a FPU operacije rade istom brzinom, što se vidi ne samo po troughput dijagramu, već i po Linpack rezultatima, koji predstavlja realni test intenzivne numerike. O tome će više reči biti kasnije.

Procesorski testovi

Izvršili smo niz uobičajenih procesorskih testova, na kojima su AMD i Cyrix pokazali impresivne rezultate (posebno Cyrix P166+: SI=907, SI95=48.5 - daleko iznad P5/200), sumirane na slici 1. Međutim, suvi testovi su jedno, a realne aplikacije nešto drugo. Pri tome treba obratiti pažnju na činjenicu da prosečna aplikacija, pored procesora i memorije, u ogromnoj meri koristi disk, video podsistem itd, tako da čak i znatna ubrzanja samog procesora ne mogu rezultirati proporcionalnim, već osetno manjim ubrzanjem čitavog računara. Izuzetak od ovog pravila su aplikacije koje intenzivno koriste procesor, a zanemarljivo disk i video podsistem.

"Teška" numerika je svakako reprezentativan primer za to. Veliki sistemi linearnih jednačina, nelinearna analiza, sopstvene vrednosti velikih matrica, kao i drugi iterativni matematički postupci ponekad umeju da potraju toliko da je to prosečnom korisniku računara gotovo nepojmljivo. Naprimer, na Afroditi, jednom od najbržih super-računara u gradu, često se mogu videti proračuni korisnika "sandra" koji umeju da potraju i duže od mesec dana (tom računaru je, inače, za Linpack potrebno 5 sekundi)! Za korisnike kojima je intenzivna numerika prevashodna preokupacija, brzina koprocesorske jedinice može biti od presudnog značaja.

Linpack test predstavlja deo realne aplikacije za proračun konstrukcija, a sastoji se od rešavanja 2081 linearne jednačine. U praksi, broj nepoznatih ponekad može biti veći od 150,000. Kao "pandan" ovom numeričkom testu, autor je iskoristio drugu, celobrojno intenzivnu aplikaciju koja, na osnovu crteža u AutoCAD-u, sastavlja model konstrukcije, tj. priprema podatke za proračun tako što traži preseke nacrtanih entiteta, proveravajući svaki sa svakim, pri čemu prilikom svakog preseka nastaju jedan ili dva nova, sve dok se ne dođe do pojedinačnih elemenata konstrukcije. Pri tome su, radi bržeg rada, koordinate izražene celobrojno, pa čitav postupak gotovo ne dotiče FPU. Kao primer za ovaj test (StruAsm) poslužilo je "asembliranje" konstrukcije od oko 80.000 stepeni slobode. Obzirom da ovaj program radi veoma brzo, postupak je ponavljan deset puta, a ukupno vreme priloženo je kao konačni rezultat. Na slici 3 dati su uporedni rezultati za Linpack i StruAsm u sekundama.

Ko dominira?

Dok i na Linpack-u dominira Pentium Pro, Cyrix 6x86 P166+ je za 56% sporiji od P5/166, za 38% od P5/133 (na istoj frekvenciji) i za 11% od P5/100, dok je P133+ prošao i gore. Oba AMD-a postižu gotovo identičan rezultat, 23% slabiji od P5/100 a 52% slabiji od P5/133. To upućuje na zaključak da je AMD u verziji PR133 poboljšao samo CPU jedinicu, dok je FPU ostao praktično isti.

Na StruAsm testu, Cyrix 6x86 P166+ je za 19% brži od P5/200 (!), 42% od P5/166 i čak 81% od P5/133, dok je 6x86 P133+ tek nešto sporiji od P5/200, a malo brži od AMD-a. Interesantna pojava primećena je kod Cyrix procesora: za razliku od svih ostalih, oni oko 7% sporije izvršavaju kôd optimizovan za Pentium od onog za 486 procesore, što se svakako mora uzeti kao mana.

Kako teče rendering

Render u CAD programima je još jedna primena kod koje se intenzivno koristi koprocesor. Na slici 1 se, u okviru tabele, nalaze i vremena renderovanja Chevy-ja (format Targa 640*480*16M) 3D Studija 4 pod DOS-om. U svrhu držanja koraka s vremenom, isti test je obavljen i u okviru 3D Studija MAX pod NT-om 3.51WS za procesore koji predstavljaju direktne "takmace". Pored toga obavljen je i jedan dugotrajniji render (TUT19_2.MAX), a mašina na kojoj je to rađeno imala je 128 MB RAM-a, Matrox Millenium 4 MB kartu i Fast SCSI-2 diskove. Rezultati su predstavljeni na slici 4.

Na "većem" render-u K5 PR133 na 100 MHz je za 23% brži od 6x86 P166+ na 133 MHz, koji je duplo sporiji od P5/166, a 66% od P5/133. Ako se ne računa render, najveći broj ostalih operacija u 3DS-u, prema subjektivnoj proceni autora, Cyrix 6x86 P166+ radi brže nego P5/166.

BMACAD2 je poslužio za testiranje pod AutoCAD-om R12 (1024*768*256 Nth Drive II V4.06). Današnji hardver je toliko brži od onoga iz vremena kada je Zdenko Šižgorić formulisao CADUA indeks, da isti nije bilo moguće korektno odrediti. Neke stavke se ne mogu izmeriti (0.00 sekundi), dok druge traju toliko kratko da rezolucija PC štoperice (0.055 s) pravi razliku i do 100% na istom procesoru u dva uzastopna ponavljanja testa, pa su te stavke (500LnTxt, FlpScr, RndVec, TxtDrv, Erase, Save, Redraw, Pan/Zoom i Sel/SSget) izbačene, mada upravo one nose najveću "težinu" u CADUA indeksu, pa je modifikovani indeks određen na osnovu preostalih stavki. Na slici 5 prikazana su ubrzanja u odnosu na P5/100 (vremena u sekundama, koja je postigao P5/100, priložena su uz nazive stavki), kao i za modifikovani CADUA indeks.

U odnosu na P5/133, K5 PR133 je sporiji po stavkama: 7 (4%), 8 (1%), 11 (4%) i 14 (16%). Cyrix 6x86 P133+ je brži jedino u stavkama 3 i 9 (15% i 2%), dok je 6x86 P166+ bio sporiji (13%) jedino na stavci 11 (Shade, jedna vrsta rendera). U odnosu na P5/166, 6x86 P166+ je sporiji po stavkama 7 (4%), 8 (10%), 11 (34%) i 14 (11%). Pentium Pro je, opet, bio van konkurencije. Prema modifikovanom Cadua indeksu, K5 PR100 je 18% bolji od P5/100, a 5% lošiji od P5/133. K5 PR133 je 8% bolji od P5/133, a 5% slabiji od P5/166. Cyrix 6x86 P133+ je 16% bolji od P5/100, a 8% lošiji od P5/133, dok je P166+ 11% bolji od P5/133, a samo 2% lošiji od P5/166.

Imajući u vidu da izbačene stavke (koje predstavljaju operacije koje se u prosečnom radu najviše koriste) nekako više naginju "klonovima", prema ovom testu može se reći da (naravno ako se izuzme operacija Shade), AMD i Cyrix predstavljaju bolji izbor za AutoCAD od odgovarajućih Intel Pentium-a. AMD K5 PR133 je direktno "tukao" P5/133 (8%), dok je 2% usporenja Cyrix-a 6x86 P166+ u odnosu na P5/166 premalo da bi moglo da opravda ogromnu razliku u ceni.

Povratak u Windows

Najveći broj testova obavljen je u Windows 95 okruženju. Radna rezolucija je bila 1024*768*16M, sa osvežavanjem od 75 Hz. Korišćeni su drajveri ATI Direct Draw v2.22 za video kartu, Intel PIIIX Bus Mastering za komunikaciju sa diskom, dok je Swap File bio fiksiran na 130 MB. Pored SI95 i WinTach, korišćeni su i ZD WinBench 96 i WinStone 96 testovi, pri čemu je WinStone posebno interesantan, pošto meri brzinu izvršavanja velikog broja realnih aplikacija. Sam WS96 je podeljen na sledeće četiri vrste primena: poslovna grafika i DTP (PageMaker 5a, Corel 5e2 i PowerPoint 4c), baze podataka (dBASE 5, Paradox 5, Access 2c i Works 3b), uporedne tabele (Lotus 1-2-3 v5, Excel 5c, Works 3b i Quattro Pro 6.01), kao i obrada teksta (Lotus AMI Pro 3.1, Word 6c, Works 3b i WordPerfect 6.1), dakle ukupno 13 najčešće korišćenih aplikacija (u kojima je i kompletan MS Office 4.3).

Na osnovu testiranja tih trinaest aplikacija, formiraju se indeksi za četiri grupe primena i kumulativni indeks Winstone 96, jedan od najrelevantihih pokazatelja brzine računara u poslovnim aplikacijama. Rezultati za SI95, WinTach, WinBench 96 i Winstone 96 priloženi na slici 1. Cyrix 6x86 P166+ se, sa 62.5 po WS96, pokazao boljim od P5/166 (61.3), dok su 6x86 P133+ (55.1) i K5 PR133 (57.3) bili lošiji od P5/133 (58.4), a bolji od P5/100 (52.2). Pentium Pro se dosta loše pokazao: P6/200 sa 60.1 je tek četvrti, iza P5/200 (64.6), 6x86 P166+ i P5/166, dok je P6/166 brži samo od P5/100 i K5 PR100. Ovo je očekivano, pošto su navedeni testovi bazirani na 16-bitnim aplikacijama, razvijanim za Windows 3.x, a poznatno je da Pentium Pro prilično slabo radi u realnom modu.

Kako je većina korisnika prešla na 32-bitni Win95 ili NT i odgovorajuće aplikacije, težište testa biće bazirano na najnovijim testovima WinBench 97 i WinStone 97, koji obuhvataju i 14 kompletnih 32-bitnih aplikacija, od kojih se za mnoge može reći da su danas "vladajuće", tj. da pokrivaju preko 90% tržišta. Aplikacije su podeljene u poslovne (Business - BS) i "zahtevne" (High End - HE). U prvoj grupi su Access7, Corel6, Excel7, Page Marker 6, Paradox 6, Power Point7, Word7 i Lotus WordPro 96. BS grupu čine tri podgrupe: obrada teksta i uporedne tabele (WP/SS: Excel, Word, WordPro), izdavaštvo (Pub: Corel, Page Marker i PPoint) i baze podataka (Dbs: Access, Paradox). Za svaku grupu se određuje Disk i Graphics Winmark 97, kao i kumulativni indeks za poslovne primene.

High-End (HE) grupa je podeljena na CAD/3D (AVS 2, MicroStation 95), obradu slike (PicEdt: Photoshop 4, Picture Publisher) i razvoj aplikacija (AppDev: MS Visual C++), za koje se računaju indeksi analogno poslovnoj grupi. Zbog velikog broja procesora i testova, na slici 6 su prikazani samo kumulativni indeksi i indeksi po grupama za direktno suprotstavljene procesore, dok se u tabeli 7 mogu naći kompletni rezultati.

Pentium Pro, u 32-bitnoj verziji test softvera, pokazuje superiorne rezultate. Što se ostalih tiče, može se reći da Cyrix 6x86 P166+ i K5 PR133 rade brže od odgovarajućih Pentium procesora na najširem polju primena. U odnosu na P5/133, koji radi na istoj frekvenciji, 6x86 P166+ je sporiji (i to samo za 1%) jedino u CAD programu MicroStation (opet "krivicom" rendera). U odnosu na P5/166, P166+ je prema WinMark-u nešto sporiji u MicroStation-u (4%) na čisto procesorskim testovima (4% i 1%), u poslovnim primenama pri radu sa diskom (3%), bazama podataka (1%) i obradi teksta (5%), dok mu je Winstone 97 bolji 3% za obe ove primene (što je najrelevantnije). AMD K5 PR133 je takođe sporiji po pojedinim WinMark stavkama od P5/133, ali i on ima bolji Winstone 97 indeks. Cyrix 6x86 P133+ se pokazao lošijim od P5/133, ali ne treba izgubiti iz vida da je on hardverski hendikepiran manjom brzinom magistrale. AMD K5 PR100 se, takođe, pokazao slabijim od P5/100.

Dobra kupovina

Iz svega ovoga se izvodi zaključak da Cyrix 6x86 P166+ i AMD K5 PR133 prosečnom korisniku donose nekoliko procenata brži rad za duplo manje para, pri čemu sam Cyrix donosi nešto više brzine u odnosu na AMD. Za korisnike koji se pomalo bave i numerikom, K5 predstavlja bolji izbor pošto, za razliku od Cyrix-a, ima proporcionalno "manje lošu" FPU jedinicu u odnosu na Pentium na istoj frekvenciji. Za one kojima je intenzivna numerika od presudnog značaja, važi ona "koliko para toliko i muzike": za duplo više para dobijaju duplo brži računar, pri čemu bi za mnoge od njih pravi izbor bio Pentium Pro koji, za doduše nekoliko puta veću cenu, donosi oko 50% ubrzanja.