Hirdetés

Bemutatta első saját AI-chipjét az OpenAI



|

A Jalapeño a ChatGPT és a Codex olcsóbb, gyorsabb futtatását segítheti.

Hirdetés

Az OpenAI bemutatta első saját tervezésű AI-gyorsítóját, a Jalapeño nevű chipet, amelyet a Broadcommal közösen készített. A processzort nem általános célú hardvernek szánják, hanem kifejezetten nagy nyelvi modellek futtatására, vagyis inference-feladatokra tervezték. Ez az a folyamat, amikor egy már betanított AI-modell válaszol a felhasználói kérésekre, például a ChatGPT-ben, a Codexben vagy az OpenAI API-jában. A Jalapeño azért fontos, mert az OpenAI működésének egyik legnagyobb költsége éppen az AI-modellek kiszolgálása. A tanítás továbbra is hatalmas számítási kapacitást igényel, de a mindennapi használatban az inference skálázása válik igazán kritikus feladattá. Minél több ember használja a ChatGPT-t, a Codexet és az OpenAI vállalati szolgáltatásait, annál fontosabb, hogy a válaszok gyorsan, megbízhatóan és minél alacsonyabb energiaigénnyel készüljenek el.

Az OpenAI szerint a Jalapeño architektúráját a saját modelljei, kiszolgálórendszerei, memóriahasználata és hálózati igényei alapján tervezték meg. A vállalat nem egy meglévő AI-gyorsítót igazított át, hanem nulláról épített olyan chipet, amely a nagy nyelvi modellek futtatásának gyakorlati terheléseire van hangolva. A korai laboreredmények alapján a Jalapeño teljesítmény/fogyasztás aránya jelentősen jobb lehet a jelenlegi élvonalbeli megoldásokénál, de a részletes technikai jelentést csak a következő hónapokban teszik közzé. A chip fejlesztésében a Broadcom a szilíciummegvalósítást és a hálózati technológiákat adja, köztük a Tomahawk hálózati megoldásokat, míg a Celestica a kártyák, rackrendszerek és integrációs feladatok területén vesz részt a platform ipari méretűvé tételében. Az OpenAI szerint a Jalapeño az első eleme egy több generációra tervezett számítási platformnak, amelyet 2026 végétől kezdenének bevezetni adatközponti partnerekkel.

Hirdetés

A vállalat azt is kiemelte, hogy a chip fejlesztését saját AI-modelljei is segítették. A Jalapeño a közlés szerint mindössze kilenc hónap alatt jutott el a kezdeti tervezéstől a gyártási tape-outig, ami rendkívül gyors tempónak számít a nagy teljesítményű félvezetők világában. Az OpenAI ezt a szoftveres és hardveres fejlesztés szoros összekapcsolásával, valamint a Broadcom tapasztalatával magyarázza. A lépés jól mutatja, merre tartanak a legnagyobb AI-cégek. Az OpenAI eddig főleg modellekkel és szolgáltatásokkal azonosult, de a Jalapeñóval egyértelműen mélyebbre megy az infrastruktúrában. A cég már nemcsak AI-modelleket fejleszt, hanem a futtatásukhoz szükséges teljes technológiai láncot is jobban kézben akarja tartani: a chiparchitektúrától a memória- és hálózati rendszereken át az ütemezésig és az adatközponti működésig.

Ez nem jelenti azt, hogy az OpenAI egyik napról a másikra megszabadulna az Nvidia hardvereitől. A tanítás és a legnagyobb teljesítményigényű feladatok továbbra is komoly GPU-kapacitást igényelnek. A Jalapeño inkább ott lehet kulcsfontosságú, ahol minden egyes válasz, minden token és minden watt számít. Ha az OpenAI olcsóbban tudja futtatni a saját modelljeit, az hosszabb távon gyorsabb válaszokat, stabilabb szolgáltatásokat és kedvezőbb költségszerkezetet hozhat.

A Jalapeño így nemcsak egy új chip, hanem stratégiai üzenet is. Az OpenAI azt akarja jelezni, hogy nem elég a legjobb modelleket megépíteni, azokat gazdaságosan és hatalmas léptékben is működtetni kell. Az AI-verseny következő szakaszában ezért már nemcsak az számít, kinek erősebb a modellje, hanem az is, ki tudja olcsóbban, gyorsabban és hatékonyabban eljuttatni azt a felhasználókhoz.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.