DataStax Inc. ma bejelentett hogy megvásárolta a Kaskada Inc.-t, a mesterséges intelligencia alkalmazások fejlesztésének megkönnyítésére összpontosító startupot.
Az ügylet feltételeit nem hozták nyilvánosságra. A Kaskada korábban 9,8 millió dollárt kapott a befektetőktől, aminek nagy része volt emelt egy 2020-ban lezárult A sorozatú finanszírozási körön keresztül.
A kaliforniai Santa Clara-i DataStax az Apache Cassandra adatbázis kereskedelmi változatát biztosítja. A Cassandra egy népszerű NoSQL-adatbázis, amely nagy mennyiségű információt képes feldolgozni, és kiterjedt megbízhatósági optimalizálásokat tartalmaz. A vállalat egy másik nyílt forráskódú projekt, az Apache Pulsar felügyelt felhőverzióját is kínálja, amelyet az alkalmazások közötti mozgásra használnak.
A DataStax ügyfelei a szoftverére támaszkodnak többféle munkaterhelés, köztük az AI-alkalmazások ellátásához. A vállalat a Kaskada felvásárlása során megszerzett technológiát használja fel gépi tanulási képességeinek fejlesztésére.
“A vállalkozásoknak valós időben kell működniük, adatok felhasználásával a műveletek végrehajtásához, valamint az azonnali, tájékozott döntésekhez és cselekvésekhez” – mondta Chet Kapoor vezérigazgató. „A DataStaxnak sok ügyfele már használ valós idejű adatokat, és a Kaskada szolgáltatási portfóliónk részeként lehetőséget biztosítunk számukra, hogy ezeket az adatokat felhasználva hatékony élményt teremtsenek ügyfeleik számára a valós idejű AI segítségével.”
Az AI fejlesztési projektek egyik legfontosabb lépése az úgynevezett funkciótervezési fázis. A funkciótervezés magában foglalja az AI-modellek által feldolgozott adatok könnyebb elemzését lehetővé tevő formává alakítását. Azáltal, hogy egyszerűbbé teszik az adatok elemzését egy mesterséges intelligencia modellhez, a fejlesztők javíthatják a feldolgozási pontosságot.
Egy szoftvercsapat mesterséges intelligencia képzési adatkészlete két sorból állhat: az egyik a hosszúságokat, a másik pedig a szélességeket tartalmazza. A tervezési szakaszban a fejlesztők egyesíthetik a hosszúsági és szélességi fokokat egyetlen koordinátává. Ez két adatot cserél egyre, ami leegyszerűsíti az AI-modellek feldolgozását.
A Kaskada olyan szoftverplatformot biztosít, amely megkönnyíti a fejlesztők számára a funkciók tervezését. A platform zászlóshajója, hogy képes megakadályozni a célpont szivárgását, ami egy olyan technikai probléma, amely gyakran felmerül a funkciótervezési folyamat során. Ha nem kezelik, a probléma kevésbé pontossá teheti az AI-modelleket.
A célpont szivárgása azért történik, mert az AI-modelleket olyan adatkészletekre kell képezni, amelyek hasonlóak ahhoz az információhoz, amelyet a gyártás során feldolgoznak. Például egy tranzakciós naplók feldolgozására épített neurális hálózatot meg kell tanítani a minta tranzakciók gyűjteményére. A célzott szivárgás akkor jelenik meg, ha az MI-t képező rekordok eltérnek azoktól a rekordoktól, amelyeket a gyártás során feldolgoz.
A Kaskada platformja csökkenti a célpont-szivárgás kockázatát azáltal, hogy segít a fejlesztőknek abban, hogy képzési adatkészleteik megfeleljenek a műszaki követelményeknek. A platform használatával a fejlesztők szűrhetik a rekordokat egy betanítási adatkészletben az egyes rekordok létrehozásának időpontja alapján. A cég szerint a rekordok szűrésének képessége lehetővé teszi a fejlesztők számára, hogy eltávolítsák azokat az adatokat, amelyek célpontok kiszivárgásához vezethetnek, és ezáltal pontosabbá tehetik mesterségesintelligencia-modelleiket.
A DataStax azt tervezi, hogy a mai akvizíció nyomán nyílt forráskódú licenc alatt adja ki a startup alaptechnológiáját. Az úton a vállalat beépíti a technológiát egy új felhő alapú gépi tanulási szolgáltatásba. A szolgáltatás várhatóan még ebben az évben debütál.