Egyáltalán nem meglepetés, hogy a mai számítógépes hardverek teljesítményének növekedése együtt jár a növekvő energiafogyasztással és hőtermeléssel - így van ez évtizedek óta. Emiatt jó ideje kulcsfontosságúvá váltak azok a mutatók, amelyek leírják egy CPU vagy GPU felvett teljesítményét és a leadott hőmennyiséget. TDP (Thermal Design Power) és TGP (Total Graphics Power) néven emlegetjük ezeket a paramétereket - de mit is jelentenek pontosan, miben különböznek, és miért fontosak a processzorok és grafikus vezérlők tervezésénél?
A TDP és TGP definíciója, mértékegysége és számítási alapelvei
A TDP (Thermal Design Power) egy hardverkomponens - tipikusan egy CPU vagy GPU - által maximálisan leadott hőteljesítményre utal, amelyet a tervezőknek figyelembe kell venniük a hűtőrendszer méretezésekor. Egyszerűbben fogalmazva, a TDP azt a (Wattban megadott) teljesítményt jelenti, amelyet az adott eszköz hő formájában lead normál működés közben, tipikusan alapórajelen, és amit a hűtőnek folyamatosan el kell tudnia vezetni. A TDP értékét a gyártók általában úgy számítják ki, hogy meghatározzák a processzor egy tipikus, maximális terhelés melletti energiafogyasztását (illetve az ezzel ekvivalens hőtermelést). Ez hagyományosan a nem turbózott, alapórajel melletti teljes terhelést jelentette, de ahogy később látni fogod, a modern dinamikus órajelnövelő technológiák miatt a helyzet ennél ma már sokkal bonyolultabb.
Ezzel szemben a TGP (Total Graphics Power) kifejezetten a grafikus kártyák teljesítményfelvételére vonatkozik. A TGP szintén Wattban megadott érték, és az egész videokártya fogyasztását jelenti, nem csak a GPU lapkáét. Vagyis magában foglalja a grafikus processzor mellett a nyomtatott áramköri lap további komponenseinek (VRM-ek, memóriachipek stb.) fogyasztását is, beleértve a hűtéshez tartozó ventilátorok és esetleges világítás energiaigényét is. Az Nvidia vezette be ezt a terminológiát az Ampere/Ada generációtól kezdve, míg az AMD hasonló értelemben a TBP (Total Board Power) kifejezést használja a grafikus kártyákra - de a TGP és a TBP fogalma lényegében megegyezik. A GPU-k esetén korábban is létezett a TDP fogalma, de ez gyakran csak magára a GPU lapkára vonatkozott; a TGP ezzel szemben totális érték, a teljes kártyára vonatkozóan.
A TDP és TGP alapjául szolgáló számítási elvek a félvezető fizika és áramköri tervezés területéről erednek. Egy processzor vagy GPU energiafogyasztását nagy vonalakban az határozza meg, hogy a tranzisztorai mekkora feszültségen és milyen kapcsolási frekvencián működnek, valamint, hogy hány tranzisztort "kapcsolnak" adott idő alatt. Ennek egyik klasszikus képlete a digitális áramkörök dinamikus fogyasztására:
Pdinamikus=C×V2×f,
ahol C az összes kapcsolódó kapacitás, V a feszültség, f pedig az órajel frekvenciája. E formula szerint a feszültség növelése négyzetes hatással van a fogyasztásra, míg a frekvencia lineárisan hat - így a magasabb órajel és feszültség kombinációja a fogyasztás és hőtermelés meredek növekedéséhez vezethet. Emellett jelen van az ún. statikus (szivárgási) teljesítményveszteség is, ami a tranzisztorok szivárgó áramaiból adódik még akkor is, ha nincs kapcsolási tevékenység. Minél kisebbek a tranzisztorok (újabbnál-újabb gyártástechnológia), általában annál nehezebb a szivárgási áramokat kordában tartani, ami az alap (üresjárati) fogyasztást is befolyásolja.
A TDP és TGP gyakorlati jelentősége - hűtés, tápellátás és rendszertervezés
A TDP és TGP értékeknek komoly gyakorlati következményei vannak az egyes konfigurációk rendszertervezésben. A hűtési rendszer méretezését elsődlegesen a TDP határozza meg. Egy processzor vagy GPU mellé olyan hűtőmegoldást kell választani (hűtőborda, ventilátor, folyadékhűtés stb.), amely képes legalább a TDP-nek megfelelő hőteljesítményt leadni folyamatosan, hogy a komponens hőmérséklete ne lépje túl a biztonságos szintet. Például egy 125 W TDP-jű CPU esetében a gyártó arra számít, hogy teljes terhelés alatt kb. 125 W hőteljesítményt kell majd a hűtésnek elvezetnie - így egy olyan hűtő szükséges, melynek hűtőkapacitása legalább ekkora. Ha alulméretezett hűtést alkalmazol, a processzor túlmelegedhet és kénytelen lesz visszavenni a teljesítményét (thermal throttling) a meghibásodás elkerülése érdekében. Ezzel szemben egy megfelelő vagy túlméretezett hűtő biztosítja, hogy a CPU/GPU a maximális terhelés mellett is az előírt hőmérséklet alatt maradjon, ami különösen fontos a mai turbó-órajelvezérlések miatt (hiszen ezek gyakran a hőfok függvényében is szabályozzák a teljesítményt).
A TDP/TGP a tápellátás és áramellátás tervezésében is kritikus szerepet játszik. A számítógép tápegységének (PSU) és az alaplapi feszültségszabályozó moduloknak (VRM-ek) biztosítaniuk kell, hogy a komponensek maximális fogyasztását ki tudják szolgálni. Például, ha egy gépben van egy 250 W-ot fogyasztó (pl. ~250 W TGP) videokártya és egy 125 W TDP-jű CPU, akkor a tápegység tervezett terheléséhez ezek összeadódnak - plusz egyéb komponensek fogyasztása. Nem véletlen, hogy az Nvidia GeForce RTX 50 sorozatnál - ahol a csúcskártyák TGP-je 350-600 W is lehet - az ajánlott tápegységkapacitás 750-850 W vagy akár 1 KW. Ugyanígy, az alaplap gyártójának is garantálnia kell, hogy a VRM képes tartósan leadni a CPU TDP-jének (és rövid ideig akár a turbó esetén aktiválódó magasabb értékeknek) megfelelő áramot túlmelegedés nélkül.
A TDP-nek rendszerszintű hatásai is vannak: magas TDP-jű processzorokat jellemzően nagyobb méretű gépházakba és olyan környezetbe szánnak, ahol a hő könnyebben elvezethető (pl. asztali PC-k, szerverek). Kis formátumú, tipikusan SFF-rendszerekben vagy laptopokban a túl magas TDP komoly kihívást jelent, mert a korlátozott térben nehéz kellően hatékony hűtést megvalósítani. Ezért mobil processzoroknál jellemzően alacsonyabb TDP-osztályokat (15 W, 45 W stb.) alkalmaznak, és a hűtési/teljesítmény-profilokat szigorúan a termikus kereteken belül tartják. Asztali környezetben pedig a gyártók gyakran TDP-kategóriákra osztják a termékeiket (pl. 65 W, 105 W, 170 W AMD-nél; 65 W, 125 W Intel-nél az asztali CPU-k esetében), és ennek megfelelően ajánlanak hűtőtípusokat (a dobozos processzorhoz csomagolt hűtő is ennek megfelelő méretű). Hasonlóképpen a GPU-knál: egy 450 W TGP-jű csúcskártya (pl. RTX 4090) háromventilátoros hűtőbordával és akár 3-4 slotnyi hellyel érkezik, míg egy 200 W-os kártya (pl. RTX 4070) sokkal kisebb hűtéssel is beéri, és kevesebb zajt termel ugyanakkora terhelésnél.
Gyártói TDP/TGP értékek vs. valós fogyasztás
Fontos megérteni, hogy a gyártók által megadott TDP és TGP értékek egy irányadó tervezési értéket jelentenek, de a valóságban a komponensek pillanatnyi fogyasztása eltérhet ettől az értéktől. Számos modern CPU és GPU képes a megadott TDP/TGP fölé is menni rövid ideig, illetve az aktuális feladattól függően a fogyasztás dinamikusan változik és gyakran a névleges maximum alatt marad. Nézzük meg, milyen eltérések adódhatnak.
Az Intel modern asztali processzorai esetében a megadott TDP lényegében a bázisteljesítmény-felvételt jelenti (12. generációtól kezdve "Processor Base Power" néven is említik), míg a processzor turbó órajelen ennél többet is felvehet rövid időintervallumon belül. Például egy Intel Core i9-13900K processzor esetében a gyári TDP (alap teljesítményfelvétel) 125 W, de a hivatalos Maximum Turbo Power értéke 253 W - ezt a magasabb fogyasztást csak addig tartja a CPU, amíg a turbó boost aktív és a hőmérsékleti, illetve áramfelvételi korlátok engedik. Intel esetében ezt a két szintet PL1 (hosszú távú fogyasztási limit) és PL2 (rövid távú turbo limit) néven ismerjük; a PL2 gyakran a TDP 1,5-2x-ese lehet.
AMD processzoroknál a helyzet hasonló, bár kicsit másképp kommunikálják: a gyártó a TDP mellé definiál egy PPT (Package Power Tracking) limitet, ami az adott processzor foglalaton keresztül felvehető maximális teljesítménye. Ez jellemzően a TDP 1,35x-öse a Ryzen processzorok "Zen" korszaka óta. Például a Ryzen 9 7950X esetében a TDP 170 W, míg a PPT ~230 W (170 × 1,35 ≈ 230) lehet. Az AMD ezzel gyakorlatilag ugyanazt valósítja meg, mint Intel a turbóval: a processzor rövid ideig a TDP-nél magasabb fogyasztással is futhat, ha a feladat megkívánja és a hőmérséklet engedi. (Az AMD alaplapokon a BIOS-ban tipikusan meg is találhatóak ezek a PPT értékek, és tuninggal módosíthatóak.) Ugyanakkor a gyártó megkülönböztet úgynevezett ECO módokat is - például egy 170 W TDP-s CPU beállítható 105 W-os vagy 65 W-os limitre is, természetesen valamivel csökkentett teljesítményért cserébe. Ilyenkor a keletkezett hő is arányosan kevesebb, ami végeredményben egyszerűbb hűtést igényel.
Egy modern processzor vagy GPU nem fix teljesítményt fogyaszt, hanem intelligensen skálázza energiafelvételét a rendelkezésre álló hő- és feszültségkeret alapján.
A GPU-knál a TGP általában a videokártya hosszabb távon fenntartható maximális fogyasztását jelenti. A valós idejű fogyasztás a terheléstől függően ingadozik: egy játék vagy számítási feladat alatt a kártya megpróbál minél közelebb kerülni a megadott TGP-hez (kihasználva a rendelkezésre álló teljesítménykeretet), de ritka, hogy jelentősen túllépje azt, hacsak felhasználóként manuálisan meg nem emeled a power limitet. Például egy NVIDIA GeForce RTX 4090 esetében a TGP 450 W, és normál körülmények között ~450 W körüli csúcsfogyasztás várható maximális terhelésnél. Persze a pillanatnyi csúcsok ettől kismértékben eltérhetnek, de a kártya beépített vezérlése (GPU Boost algoritmus) gondoskodik róla, hogy tartósan ne lépje túl ezt az értéket.
AMD kártyáknál hasonló a helyzet: pl. az előző generációs csúcsmodell Radeon RX 7900 XTX esetében a TBP 355 W, de egyes mérések szerint tuning nélkül is előfordulhat ~360-380 W pillanatnyi fogyasztási csúcs, sőt manuális beállításokkal akár 400 W fölé is engedhető a kártya.
Valós használat vs. specifikáció
Érdemes megjegyezni, hogy a TDP/TGP egy laboratóriumi meghatározott forgatókönyvre vonatkozik. Reális, vegyes terhelés alatt a processzorok/GPU-k ritkán futnak tartósan a maximumon. Böngészés vagy kevésbé megterhelő feladat alatt messze TDP alatti a fogyasztás, hiszen ilyenkor a frekvencia és feszültség is lecsökken. Ugyanakkor bizonyos speciális munkaterhelések (pl. stressztesztek, FPU-intenzív kódrészletek vagy bányászalgoritmusok a GPU-n) képesek a komponenseket a maximális fogyasztásuk közelébe vagy akár fölé hajtani a turbo keretek erejéig. Ezért a hűtést és a tápegységet mindig a "legrosszabb eset" szerint kell méretezni - pontosan erre valók a gyártói TDP/TGP számok. A rendszer stabilitása és élettartama múlhat azon, hogy a komponensek nem lépik-e túl a nekik szánt termikus és energiafelhasználási kereteket.
Tehát a gyártói TDP és TGP értékek iránymutatók, de nem abszolút korlátok. A modern boost-mechanizmusok révén a CPU/GPU-k intelligens vezérléssel próbálják a teljesítményüket maximalizálni, ami azt jelenti, hogy időlegesen túlléphetik a TDP-t, ha a hűtés és a VRM ezt lehetővé teszi. Emiatt a valós fogyasztás gyakran magasabb lehet a specifikációs lapokon látott számnál, különösen rövid idejű terhelési csúcsok során. Ugyanakkor a mérnökök szándéka nem a vásárlók megtévesztése: a TDP/TGP azért van, hogy egy tervezhető, tartós értéket adjon meg - a tényleges fogyasztás pedig ennél rugalmasabban alakulhat, a teljesítmény és hőmérséklet függvényében.
A gyártástechnológia hatása a fogyasztásra és hőtermelésre
Az elmúlt években a félvezetőgyártás folyamatosan fejlődött: a vezető gyártók (TSMC, Intel, Samsung) sorra vezetik be az egyre kisebb csíkszélességű technológiákat (7 nm, 5 nm, 3 nm stb.). Általános ökölszabály, hogy a kisebb csíkszélességű node-ok jobb energiahatékonyságot tesznek lehetővé: az újabb generációs tranzisztorok ugyanazon teljesítményt alacsonyabb feszültségen vagy kevesebb kapcsolási veszteséggel tudják elérni. Például összehasonlítva a 7 nm-es és 5 nm-es technológiát, publikált adatok alapján kb. 30%-kal nőtt a tranzisztorsűrűség és ~20%-kal csökkenthető a fogyasztás azonos teljesítmény mellett. Ez elméletben azt jelenti, hogy egy 5 nm-es lapka sokkal takarékosabb lehet, mint 7 nm-es elődje, ha ugyanarra a feladatra fogjuk be.
A gyakorlatban azonban nem ennyire egyszerű a kép. A kisebb csíkszélesség együtt jár a nagyobb tranzisztorsűrűséggel, ami viszont a teljesítménysűrűség növekedését eredményezheti. Hiába lenne egy-egy tranzisztor hatékonyabb, ha sokkal többet zsúfolunk egy lapkába és magas órajelen járatjuk őket, a teljes chip fogyasztása ismét magas lesz. Sőt, a magas tranzisztorsűrűség hőtermelési gócpontokat hozhat létre: az 5 nm-es csúcslapkákon nagyon kicsi területen koncentrálódhat 100-200 W hő, ami extrém hőmérsékleteket eredményezhet, ha nem történik meg a hő gyors elvezetése. Iparági szakértőktől sokszor hallani, hogy a 7 nm-ről 5 nm-re lépés a nagy teljesítményű chipeknél nem minden szempontból előnyös: mert bár nyerünk tranzisztorsűrűségben, a magasabb hőmérséklet és szivárgási áram korlátozhatja az órajel-növelés lehetőségét. Magyarán, a gyártók hiába csökkentik a csíkszélességet, a fizika törvényei miatt nem tudják a fogyasztást a végtelenségig kordában tartani - ha a teljesítménycélok nőnek, akkor a csúcsfogyasztás is magas maradhat.
A 3D stacking és chiplet dizájn új dimenziókat nyit a teljesítmény optimalizálásában - de a hőtermelés továbbra is a legnagyobb kihívás marad.
Ugyanakkor a modernebb csíkszélesség előnye a választási lehetőségben rejlik: a mérnökök dönthetnek úgy, hogy az extra tranzisztorsűrűséget és sebességet nem a teljesítmény további növelésére fordítják, hanem inkább a fogyasztást csökkentik. Erre látunk is példát a hatékonyságra hangolt termékeknél (pl. mobil processzorok, alacsony fogyasztású GPU-k). A 3 nm-en gyártott Apple M-szériás chipek például igen jó teljesítmény/Watt mutatókat érnek el, mivel konzervatív órajeleken működnek, így nem futnak a teljesítménygörbe extrém végein. Ezzel szemben egy asztali GPU, mint az RTX 4090, 5 nm ide vagy oda, ugyanúgy 450 W-ot vesz fel, mert arra optimalizálták, hogy a lehető leggyorsabb legyen, nem arra, hogy a lehető legtakarékosabb. A kisebb csíkszélesség tehát lehetővé tesz alacsonyabb fogyasztást azonos teljesítményhez, de nem garantálja azt - a konkrét értékeket a tervezési döntések és a termék célpiaca határozza meg.
Teljesítményfelvétel és hőtermelés összefüggései, optimalizálásuk
Már többször utaltunk rá, hogy a nagyobb teljesítmény általában nagyobb fogyasztással és hőtermeléssel jár. A számítástechnika alapvető törvénye, hogy a felvett elektromos energia túlnyomó része végül hővé alakul a processzorban vagy GPU-ban (a hatásfok közel 100%, hiszen mechanikus mozgás alig van, a számítási munkát végző tranzisztorok lényegében mind hőt generálnak). Emiatt a teljesítményfelvétel és a hőtermelés szorosan lineáris kapcsolatban áll: ha egy CPU 2x annyi energiát vesz fel, akkor nagyjából 2x annyi hőt is ad le. Ezért is használják a Wattot mindkettő jellemzésére - 1 Watt elektromos teljesítmény pont 1 Joule energiát jelent másodpercenként, ami 1 Joule hőenergiát fog jelenteni a hűtőrendszer számára, amit el kell vezetnie.
Ami ennél érdekesebb, az a számítási teljesítmény és a fogyasztás viszonya. Ideális esetben szeretnénk minél több műveletet végrehajtani minél kevesebb Joule energiából - vagyis jó energiahatékonyságra törekszünk. Azonban a félvezetők úgy működnek, hogy a magasabb órajelekhez és feszültségekhez aránytalanul nagy fogyasztásnövekedés társul. Gyakran emlegetik, hogy egy processzort a maximális órajelének közelébe hajtva a csökkenő hozam effektus lép fel: egyre több Watt kell minden további teljesítmény-százalék kinyeréséhez. Például lehet, hogy egy CPU 3 GHz-en 65 W-ot fogyaszt, 4 GHz-en 105 W-ot, 5 GHz-en pedig már 200 W-ot - a plusz 1 GHz emelés a végén sokkal többe kerül wattban, mint az elején. Ezért a gyártók és pl. a tuningolást kedvelők is balanszíroznak: meddig érdemes elmenni órajelben, ahol még jó hatásfokkal nyerünk teljesítményt, és honnantól pazarlás az energia a kevés plusz sebességért.
Az optimalizáció két fő szempontja tehát: egyrészt a mikroarchitektúra fejlesztése, hogy adott órajelen több műveletet lehessen végrehajtani (IPC növelése), másrészt a működési pont (órajel/feszültség) megválasztása, hogy jó hatékonyság mellett üzemeljen a lapka. Az IPC növelése (pl. párhuzamos végrehajtóegységek, jobb algoritmusok a hardverben) lehetővé teszi, hogy alacsonyabb órajelen is nagy teljesítményt érjen el a CPU/GPU - ez jót tesz a fogyasztásnak. A másik oldalról, a működési pont megválasztására példa az, amikor egy GPU-n beállítjuk a power limitet mondjuk 90%-ra: sok esetben a teljesítmény alig csökken (~95-97%-ára), miközben a fogyasztás 10%-kal vagy többel is mérséklődhet, mert a chip az effektív tartományában dolgozik. Ez azt is mutatja, hogy a csúcs TDP/TGP értékek gyakran az utolsó csepp teljesítményt hivatottak kihozni a chipből, nem a leghatékonyabb ponton üzemeltetik feltétlenül. Épp ezért van jelentősége az olyan funkcióknak, mint az Eco Mode, alulfeszelés stb., amelyekkel a felhasználó beállíthatja a saját preferenciája szerint a teljesítmény-fogyasztás kompromisszumot.
Egy konkrét példa: az Intel 13. vagy 14. generációs i9 processzorai köztudottan nagyon magas fogyasztással mennek alapbeállításon. Sok felhasználó azonban arról számolt be, hogy ha a PL1/PL2 értékeket lejjebb veszik (pl. fix 200 W plafon vagy épp 125 W-ra limitálják a chipet), akkor a teljesítményük csak 5-10%-kal csökken, viszont a hőtermelés és hűtési igény drasztikusan bezuhan. Hasonlóképp, egy csúcskategóriás GPU-t, mondjuk egy RTX 4080-at, úgy lehet alulfeszelni (feszültségcsökkentés és enyhe órajelkorlátozás), hogy a gyakorlati teljesítménye megmarad 95%-ban, de a fogyasztása a 350 W helyett mondjuk 250-270 W legyen, ami ~20%-os megtakarítás hőtermelésben. Az efféle optimalizálás egyre népszerűbb, mert az elektromos áram drága, a hűtés zaja zavaró, és a környezetterhelés sem elhanyagolható szempont.
Van, aki forrón szereti
A TDP és TGP fogalmak megértése elengedhetetlen a modern PC-komponensek világában. Ezek a számok keretet adnak a mérnököknek, gyártóknak és felhasználóknak, de nem kőbe vésett értékek - inkább irányjelzők egy folyamatosan változó, dinamikus rendszerben. A mai CPU-k és GPU-k már intelligensen képesek igazodni a pillanatnyi igényekhez, és a teljesítményüket a termikus keretük határáig srófolni. A jövőben a gyártástechnológia további fejlődésével (3 nm és azon túl), a chiplet és 3D stacking kiforrottabb alkalmazásával, valamint az egyre okosabb energia-menedzsmenttel (mind hardveres, mind szoftveres oldalról) valószínűleg tovább javul a teljesítmény/watt arány. Ugyanakkor fizikai korlátok mindig lesznek - a hőt el kell vezetni, a nagy teljesítménynek pedig ára van - Wattban.