A Meta mesterséges intelligencia rendszert fejleszt a Wikipédia idézetek áttekintésére

0
A Meta mesterséges intelligencia rendszert fejleszt a Wikipédia idézetek áttekintésére

A Meta Platforms Inc. kifejlesztett egy mesterséges intelligencia-rendszert, amely képes beolvasni a Wikipédia-cikket, elemezni a cikkben hivatkozott forrásokat, és megállapítani, hogy szükség lehet-e néhány módosításra.

A Meta ma részletezte az AI-rendszert. A cég nyílt forráskódú licenc alatt is kiadta a rendszer kódját.

A Wikipédia szerkesztői biztosítják, hogy egy adott Wikipédia-cikkben szereplő információ pontos legyen azáltal, hogy ellenőrzik azt a forrást, ahonnan az információt lekérték. A cikkben hivatkozott összes forrás ellenőrzése időigényes folyamat lehet. A Wikipédia több millió oldalt tartalmaz, amelyek némelyike ​​több száz idézetet tartalmaz.

A Meta újonnan kiadott mesterséges intelligencia rendszere a Wikipédia szerkesztőinek munkáját kívánja megkönnyíteni azáltal, hogy részben automatizálja az idézetek áttekintésének feladatát. A rendszer képes beolvasni egy cikket, és azonosítani tudja, vannak-e olyan információk, amelyeket megkérdőjelezhető idézet támaszt alá. Sőt, relevánsabb forrásokat is tud ajánlani, amelyekkel a megkérdőjelezhető idézet helyettesíthető.

Egy bizonyos Apple Inc. termékről szóló Wikipédia-cikk véletlenül hivatkozhat az Apple webhelyének egy olyan oldalára, amely egy teljesen más terméket tárgyal. A Meta újonnan részletezett mesterséges intelligencia-rendszere megállapíthatja, hogy egy ilyen hivatkozás helytelen. Ezenkívül javasolhatja az Apple webhelyének megfelelő oldalát, amelyre a Wikipédia-cikknek hivatkoznia kell.

A Meta megtanította a mesterséges intelligencia rendszert a hibás idézetek észlelésére úgy, hogy a Wikipédiából származó információ 4 millió részletére tanította. Ezenkívül a Meta létrehozott egy Sphere nevű adatkészletet, amely 134 millió, a nyílt webről származó dokumentumot tartalmaz. Amikor megkérdőjelezhető idézetet talál egy Wikipédia-cikkben, az AI-rendszer átkutat a Sphere adatkészlet dokumentumaiban, hogy relevánsabb forrást találjon.

Az a folyamat, amelyen keresztül a rendszer új forrást talál, amellyel egy megkérdőjelezhető idézet helyettesíthető, több lépésből áll.

Mivel a Sphere adatkészlet 134 millió dokumentumot tartalmaz, a potenciális hivatkozások keresése jelentős időt vehet igénybe. A Meta kutatói speciális indexek gyűjteményének kidolgozásával gyorsították fel a feladatot. Adatkezelési kontextusban az indexek olyan parancsikonok gyűjteményei, amelyek lehetővé teszik bizonyos információk gyorsabb megtalálását.

A Meta mesterséges intelligencia rendszere a cég által kifejlesztett indexeket használja fel arra, hogy gyorsabban keressen a Sphere adatkészletben az idézetek után, mint ahogy ez egyébként lehetséges lenne. Amikor a rendszer talál egy dokumentumot, amely potenciálisan forrásként hivatkozhat, kivonja a dokumentumból a legrelevánsabb részt. Azt is képes meghatározni, hogy van-e több olyan dokumentum, amely potenciálisan megjelölhető forrásként.

A Meta szerint a rendszer úgy határozza meg, hogy a Sphere dokumentuma biztonsági másolatot készít-e egy Wikipédia-cikkben található információról úgy, hogy mindkét szövegrészletet matematikai ábrázolásmóddal készít. Ezeket a matematikai reprezentációkat ezután összehasonlítják, hogy meghatározzák, melyik a legrelevánsabb.

„Eszközeinket arra terveztük, hogy összehasonlítsuk ezeket a reprezentációkat, hogy megállapíthassuk, az egyik állítás alátámasztja-e vagy ellentmond-e egy másiknak” – részletezik a Meta kutatói. blog bejegyzés Ma. Ha a mesterséges intelligencia rendszer több olyan dokumentumot talál, amelyre forrásként hivatkozhat, rangsorolja azokat az alapján, hogy mekkora valószínűséggel relevánsak.

„A modell a finomszemcsés nyelvi megértés segítségével rangsorolja a hivatkozott forrást és a lehívott alternatívákat aszerint, hogy mekkora valószínűséggel támasztják alá az állítást” – fejtették ki a kutatók. “Ha a valós világban alkalmazzák, a modell a legrelevánsabb URL-eket kínálja fel leendő hivatkozásként egy emberi szerkesztő számára, amelyet át kell tekinteni és jóváhagyni.”

Magán az AI-rendszeren kívül a Metának is van nyílt forráskódú a Sphere adatbázis és az általa kifejlesztett indexek az adatbázisban való könnyebb keresés érdekében. Sőt, a cég kiadja egy belső eszköz kódját, az elosztott-faiss-t. Az eszköz lehetővé teszi az indexek futtatását több szerveren, nem pedig egyetlen gépen, ami leegyszerűsíti a feldolgozást.

A Meta úgy véli, hogy mesterséges intelligencia rendszere, a Sphere adatkészlet és a mérnökei által a projekt részeként kifejlesztett többi komponens a jövőben többféle felhasználási esetet támogathat. „Ezek a modellek a potenciális szerkesztők első összetevői, amelyek segíthetnek a dokumentumok valós időben történő ellenőrzésében” – részletezte a vállalat. „Az idézetek javaslata mellett a rendszer automatikusan kiegészítõ szöveget javasol – a weben található releváns dokumentumok alapján – és lektorálási javításokat kínál.”

Kép: Meta

Mutassa támogatását küldetésünk iránt, ha csatlakozik a Cube Club és a Cube Event Community szakértőiből. Csatlakozzon ahhoz a közösséghez, amelyben az Amazon Web Services és az Amazon.com vezérigazgatója, Andy Jassy, ​​a Dell Technologies alapítója és vezérigazgatója, Michael Dell, az Intel vezérigazgatója, Pat Gelsinger és még sok más fényes és szakértő található.

hasonló hozzászólások

Leave a Reply