A Meta MultiRay platformja aggregálja a kiváló minőségű, nagyméretű mesterséges intelligencia modellek képzését

1
A Meta MultiRay platformja aggregálja a kiváló minőségű, nagyméretű mesterséges intelligencia modellek képzését

Facebook anyavállalat Meta Platforms Inc. ma lerántotta a leplet legújabb innovációjáról a mesterséges intelligencia képzésben. Úgy hívják, hogy MultiRay, egy új platform a legerősebb mesterséges intelligencia modellek nagy léptékű futtatásához, nagyobb hatékonysággal és alacsonyabb költségekkel.

Meta kifejtette a blog bejegyzés hogy mostanáig sok vállalat kénytelen volt kompromisszumokat kötni mesterséges intelligencia rendszerével kapcsolatban. A lehető legjobb eredmények elérése érdekében a szöveget, képeket és egyéb módozatokat feldolgozó mesterséges intelligencia rendszert hatalmas adathalmazra kell képezni, majd speciális feladatra kell szakosodni, például a gyűlöletbeszéd azonosítására.

Az eredmény egy kiváló minőségű, de rendkívül drága egytrükkös póni: a modell kiválóan képes észlelni a gyűlöletbeszédet, de ez minden. Így a folyamat rendkívül költségessé válik azon csapatok számára, amelyek több probléma megoldására akarnak mesterséges intelligenciát használni. Ennek eredményeként a leginkább alkalmas mesterséges intelligencia modelleket ritkán használják a való világban, és a vállalatok általában kisebb, egyszerűbb és kevésbé alkalmas algoritmusokra támaszkodnak.

A MultiRay megváltoztatja ezt azáltal, hogy lehetővé teszi az AI-képzés eredményeinek több különböző feladathoz való újrafelhasználását. Számos, meghatározott feladatokra kiképzett AI-modell futtatható ugyanazon a bemeneten, így megosztva a feldolgozási költségeket közöttük. Ez sokkal alacsonyabb modellenkénti feldolgozási költséget eredményez, ha erősebb AI-modelleket hoz létre.

“Ez segít nekünk optimalizálni az AI-feladatok végrehajtásának teljes költségét” – írta a Meta AI csapata egy blogbejegyzésében. “A vállalati szintű számítások egyetlen modellbe való koncentrálása miatt könnyebben bevezethetünk mesterséges intelligenciagyorsítókat, valamint vállalati szinten kompromisszumot tudunk tenni a számítási teljesítmény és a tárhely között.”

A MultiRay létrehozza a Meta által „univerzálisnak” nevezett modelleket, amelyeket arra képeztek ki, hogy a feladatok és tartományok széles körében hatékonyan teljesítsenek. Ezekről a csúcsmodellekről bebizonyosodott, hogy jobb minőségű eredményeket biztosítanak, lehetővé téve a Meta csapatai számára, hogy javítsák és gyorsan iterálják a gépi tanulási modellek különféle típusait számos alkalmazáshoz, mint például a bejegyzések témacímkézése, a gyűlöletbeszéd-észlelés. , álhírek és így tovább. A Meta első ilyen modelljét TextRay-nek hívják, és 2020 óta működik, hogy támogassa a különféle szövegértési alkalmazásokat.

A Meta a MultiRay segítségével AI-rendszereket hoz létre több modalitáson, mint önmagában. Például egyes Facebook-bejegyzések szöveget, képeket és videót tartalmazhatnak. Ebben az esetben a mesterséges intelligencia rendszereinek ezeket az elemeket külön kell elemezniük, és a többivel összefüggésben kell értékelniük. Normális esetben ez több számításigényes modell egy sokkal nagyobb, még intenzívebb modellbe való kombinálását jelentené.

„A számítási és energiafogyasztás ebből eredő növekedése lelassítja azon erőfeszítéseinket, hogy a legfejlettebb ML-modelleket hozzuk forgalomba termékeink és szolgáltatásaink gyártásába” – magyarázta Meta.

Ennek a kihívásnak a megoldására a Meta létrehozta a PostRay-t, amely egyetlen modellben egyesíti a szöveg- és képértési képességeket. Mivel a PostRay modellek több képességet is tartalmaznak egyetlen modellben, bonyolultabb a betanításuk, telepítésük és karbantartásuk. A MultiRay használatával azonban a Meta szerint csak egyszer kell végrehajtania ezeket a feladatokat, és ezt a modellt a vállalaton belül több tucat különböző csapat használhatja újra.

“Egy központi rendszer, amely egy mindenre kiterjedő modellt szolgál ki, lehetővé teszi számunkra, hogy közvetlenül a legmodernebb kutatócsoportokkal dolgozzunk együtt, és munkájukat a megjelenés után hamarosan gyártásba hozzuk” – mondták a Meta kutatói.

A Meta szerint az AI-modellek központosításának két fő előnye van, amelyek közül az első a több csapatra kiterjedő amortizáció. Általában a nagy teljesítményű modellek betanítása hatalmas igényt támaszt olyan erőforrásokra, mint a grafikus feldolgozó egységek, és minden modellt külön kell képezni. A MultiRay segítségével a csapatok egyszerre több modellt képezhetnek ki, és megoszthatják a számlát közöttük, mivel mindannyian ugyanazokat az erőforrásokat élvezhetik.

A másik előny, hogy a MultiRay egyszerűbb fejlesztési és üzemeltetési folyamatot tesz lehetővé. “A MultiRay kis számú nagy, központosított modellt szolgál ki, lehetővé téve, hogy egyetlen csapat kezelje a műveletek és az optimalizálás nagy részét” – magyarázta a vállalat. „Az ügyfélcsapatok kisebb, feladatspecifikus modellekkel rendelkeznek, amelyek könnyebben kezelhetők. Ez lehetővé teszi számos olyan csapat számára, amely nem rendelkezett a sávszélességgel a legmodernebb mesterséges intelligencia képzéséhez, telepítéséhez és kezeléséhez, hogy használja ezt a technológiát.”

A Meta elismerte, hogy a MultiRay bevezetése számos új kihíváshoz vezetett az ügyfélkezelés, a kvóták és a költség-hozzárendelés terén, amelyeket korábban már megoldottak. Mivel a lekérdezés mérete és a gyorsítótár találati aránya egyaránt befolyásolja a lekérdezések feldolgozásához szükséges energiát, az olyan dolgok, mint a kvóták, bonyolultabbá válnak.

Ezenkívül a kiváló minőségű MultiRay modellek képzési költségeinek megosztása csak akkor működik, ha mindegyik modellt széles körben használják. Tehát a modelleknek a legkorszerűbb minőséget kell nyújtaniuk több felhasználási esetben is. Ennek biztosítása érdekében a Metának komoly beruházásokat kellett végrehajtania a modellfrissítésbe, valamint új modellarchitektúrák és képzési folyamatok innovációjába, hogy a kutatást a gyártási időre csökkentse.

A Meta nem mondott semmit a MultiRay-t működtető kód nyílt forráskódú beszerzéséről, vagy arról, hogy más szervezetek vagy kutatók számára elérhetővé teszi-e. Ennek ellenére a Meta története során AI-kutatásainak nagy részét elérhetővé tette a közösség számára, így mások is hamarosan profitálhatnak a MultiRay képességeiből.

Kép: Freepik

Mutassa támogatását küldetésünk iránt, ha csatlakozik a Cube Club és a Cube Event Community szakértőiből. Csatlakozzon ahhoz a közösséghez, amelyben az Amazon Web Services és az Amazon.com vezérigazgatója, Andy Jassy, ​​a Dell Technologies alapítója és vezérigazgatója, Michael Dell, az Intel vezérigazgatója, Pat Gelsinger és még sok más fényes és szakértő található.

hasonló hozzászólások

Leave a Reply