Openai tänään käynnisti ChatgPT -agentin, joka on tähän mennessä tehokkain AI -avustaja, pyrkii luomaan työkalun, joka täydentää aktiivisesti käyttäjille työtä sen sijaan, että vastaisi kysymyksiin. Uusi agentti käyttää ”virtuaalista tietokonetta” monimutkaisten, monivaiheisten tehtävien suorittamiseen.
Maksetuille tilaajille 17. heinäkuuta alkaen agentti integroi Openain aikaisemman operaattorin ja syvien tutkimustyökalujen ominaisuudet. Tämä lanseeraus laajentaa agentisen AI: n ylivallan kilpailua, joka on OpenAi Googlen, Antropicin ja Microsoftin aloitteita vastaan.
Liittyvät:Openai saapuu kriisitilaan: Miksi GPT-5 on totuuden hetki chatgpt-valmistajalle
Muutto merkitsee strategisen siirtymisen keskusteluun AI: sta järjestelmiin, jotka pystyvät hallitsemaan itsenäisesti digitaalisia työnkulkuja. Se korvaa yhtiön Operator-työkalun, joka esiteltiin ensimmäisen kerran tammikuussa 2025 rajoitetumpana, selainpohjaisena edustajana.
Tehokkaampi edustaja tekemään tarjouksesi
Chatgpt -agenttiedustaa Openain rohkeinta yritystä vielä luoda todella agenttinen tuote. Se onVirtaisi uusi, nimeämätön malli Openai O3 -perheestä. Järjestelmä on suunniteltu purkamaan käyttäjien monimutkaisia tehtäviä, kuten suunnittelutapahtumia tarkistamalla kalenteri tai luomalla liukukannen.
Uuden työkalun rakentamiseksi OpenAI yhdisti sekä operaattorin että syvän tutkimuksen takana olevat ryhmät luomalla yhtenäisen ryhmän, joka keskittyi tähän uuteen agentiseen suuntaan. Tämä sisäinen rakenneuudistus korostaa yksinkertaisten chatbotien siirtymisen strategista merkitystä.
Toisin kuin edeltäjänsä, ChatgPT -agentti on varustettu kattavammilla työkaluilla. Siinä yhdistyvät visuaalisen etäselaimen päätelaitteeseen koodin suorittamiseen, data -analyysin suorittamiseen ja jopa laskentataulukoiden luomiseen.
Yash Kumar, Openain agentin tuotejohto, selitti, että ”koska ChatgPT -agentti on pääsy” koko tietokoneelle ”vain selaimen sijasta, he ovat" parantaneet työkalusarjaa melko vähän "." Tämä laajennettu työkalusarja sisältää myös liittimiä, jolloin agentti pääsee ulkoisiin tietolähteisiin ja sovelluksiin, kuten Google Drive, ja merkittävä askel edellisistä tarjouksista.
Perusmallissa on huipputeknistä suorituskykyä vaikeissa vertailuarvoissa. Frontiermathissa, haastavassa matematiikan testissä, agentti sai 27,4% käytettäessä työkalujaan, massiivinen harppaus edellisen huipputason O4-Mini-saavuttamasta 6,3%: sta.
Openai myöntää, että työkalua ei ole rakennettu nopeuteen. Tutkimusjohto Isa Fulford totesi, että käyttäjien ei ole tarkoitus katsella sitä toimimaan, kehystämällä sitä taustaassistentti. "Vaikka se vie 15 minuuttia, puoli tuntia, se on melko suuri nopeus verrattuna siihen, kuinka kauan sen tekeminen vie", hän sanoi korostaen sen roolia aikaa vievien prosessien käsittelyssä.
'Varotoimenpiteen lähestymistapa' turvallisuuteen ja hallintaan
Agentin parannettujen ominaisuuksien vuoksi Openai aktivoituusuojatoimenpiteet sen valmiuskehyksestä. Tämä on varotoimenpide potentiaalista väärinkäyttöä vastaan, etenkin biologisissa ja kemiallisissa domeeneissa, jopa ilman suoria todisteita riskistä.
Käyttäjän hallinta on keskeinen teema. Fulford vahvisti, että "ennen chatgpt -agentti tekee jotain" peruuttamatonta ", kuten sähköpostin lähettämisen tai varauksen lähettämisen, se pyytää ensin lupaa." Tämä käyttäjän vahvistusvaihe on kriittinen toimille, joilla on reaalimaailman seurauksia, jotka perustuvat aikaisemman operaattorin agentin turvallisuussuunnitelmaan.
Lisäkerrokset sisältävät ”kellotila”. Tämä ominaisuus keskeyttää agentin suorittamisen automaattisesti arkaluontoisilla verkkosivustoilla, kuten finanssiportaaleilla, jos käyttäjä navigoi pois välilehdestä. Lisäksi OpenAi on poistanut CHATGPT: n muistiominaisuuden käynnistyksen yhteydessä, jotta voidaan lieventää datan suodatusriskejä nopeasta injektiohyökkäyksestä.
Kilpailu agentisesta AI: stä kuumenee
ChatgPT -agentin lanseeraus tehostaa kilpailua tärkeimpien teknologiapelaajien keskuudessa. Se on suora vastaus kilpailijoiden vastaaviin työkaluihin. Antropinen oli varhaisessa vaiheessa sen ”tietokoneen käyttö” -ominaisuuksilla Claude -malleille, joka julkaistiin lokakuussa 2024.
Google on myös voimakkaasti sijoitettu projektin merimiehensä ja AI -studiossa ”tietokoneen käyttö” -toiminnon testit. Myös Microsoft upottaa agenttien kaltaisia ominaisuuksia Copilot-studioonsa. Charles Lamanna, Microsoft VP, vangitsi tiiviisti tavoitteen: "Jos henkilö voi käyttää sovellusta, myös agentti voi."
Jo ennen tätä lanseerausta Openain operaattori osoitti kilpailuedun, joka ylittää kilpailijat vertailuarvoilla, kuten WebVoyager ja Osworld, jotka testiselain ja järjestelmätason tehtävät. Tämä historia asettaa korkean palkin uudelle, kykenevälle edustajalle.
Suositeltu lukeminen:Openai's Chatgpt Agent Out Out: Uusi aikakausi automatisoiduista digitaalisten tehtävämiesten jäsenistä
Tämä kilpailukykyinen työntö tulee huolimatta agenttien tehokkuudesta. Äskettäisessä Carnegie Mellon -tutkimuksessa havaittiin, että jopa Top AI -mallit kamppailevat liiketoiminnan automaatiotehtävien kanssa,Korostaminen järkeä ja selaamista koskevia ongelmia. Openain uusi agentti mitataan näitä reaalimaailman suorituskyvyn vertailuarvoja vastaan.














