Az OpenAI január 23-án bejelentette legújabb fejlesztését, az Operator nevű mesterséges intelligencia ágenst, amely képes önállóan végrehajtani különböző webes feladatokat. Ez az új technológia jelentős mérföldkő az AI fejlesztésében, hiszen először teszi lehetővé, hogy egy mesterséges intelligencia teljes mértékben átvegye az irányítást egy böngészőben.
Az Operator egy általános célú AI ágens, amely képes áttérni a webes böngészők irányítására és függetlenül végrehajtani bizonyos műveleteket. Az új szolgáltatás először az amerikai felhasználók számára érhető el a ChatGPT 200 dolláros Pro előfizetési csomagjában.
Így működik az új AI asszisztens
Az Operator egy úgynevezett Computer-Using Agent (CUA) modell által működik, amely a GPT-4o látási képességeit ötvözi fejlett gondolkodási képességekkel. A CUA úgy van betanítva, hogy a grafikus felhasználói felületekkel – gombokkal, menükkel és szövegmezőkkel – kommunikáljon, pontosan úgy, ahogyan azt az emberek teszik.
A CUA úgy van betanítva, hogy a weboldalak felhasználói felületével kommunikáljon, ami azt jelenti, hogy nincs szüksége fejlesztői API-kra különböző szolgáltatások használatához. Más szavakkal, a CUA képes gombokat használni, menükben navigálni és űrlapokat kitölteni egy weboldalon, hasonlóan az emberekhez.
Mit tud az Operator?
Az Operator egy webalkalmazás, amely képes egyszerű online feladatok elvégzésére egy böngészőben, mint például koncertjegyek foglalása vagy online bevásárlás lebonyolítása. A rendszer különböző mindennapi feladatok automatizálását teszi lehetővé:
- Online rendelések leadása
- Utazások lefoglalása
- Találkozók ütemezése
- Különböző webes űrlapok kitöltése
- Ételrendelés közvetítő oldalakon keresztül
Az OpenAI együttműködik olyan vállalatokkal, mint a DoorDash, eBay, Instacart, Priceline, StubHub és Uber, hogy biztosítsa az Operator szolgáltatási feltételeknek való megfelelését.
Biztonsági intézkedések és korlátok
Az Operator jelenleg még korai kutatási előzetes állapotban van, és bár már képes számos feladat elvégzésére, még tanul és fejlődik, eközben hibákat is véthet. Például jelenleg kihívást jelentenek számára az összetett felületek, mint a prezentációk készítése vagy naptárak kezelése.
A CUA modell úgy van betanítva, hogy felhasználói megerősítést kérjen, mielőtt külső hatással járó feladatokat véglegesítene, például rendelés leadása vagy e-mail küldése előtt. Az OpenAI óvatosságból egyes feladatoknál, mint a banki tranzakciók, felügyeletet igényel – a felhasználóknak maguknak kell megadniuk a hitelkártya-adatokat.
A jövő tervei
Az OpenAI tervei szerint a jövőben kibővíti az Operator elérhetőségét a Plus, Team és Enterprise felhasználókra, és integrálja ezeket a képességeket a ChatGPT-be. A cég azt tervezi, hogy a CUA szélesebb körű képességeit a jövőben API-n keresztül teszi elérhetővé más fejlesztők számára saját alkalmazások készítéséhez. Ez hasonló ahhoz, ahogyan az Anthropic decemberben kiadta Computer Use funkcióját.
Az Operator bejelentése azt jelzi, hogy a mesterséges intelligencia fejlesztése egy új szakaszba lépett, ahol az AI már nemcsak válaszol a kérdésekre, hanem aktívan cselekedni is képes a digitális világban. Ez a technológia alapvetően megváltoztathatja, ahogyan mindennapi online feladatainkat végezzük.
Forrás: TechCrunch - https://techcrunch.com/2025/01/23/openai-launches-operator-an-ai-agent-that-performs-tasks-autonomously/
A cikk AI segítségével készült, hiteles nemzetközi forrásokból származó információk alapján.