Alibaba julkaisee Websailorin, avoimen lähdekoodin AI-agentin, joka pyrkii 'ylimääräiseen' päättelyyn

Alibaba kiihdyttää Global AI -kilpailua Websailorin, uuden avoimen lähdekoodin Web-agentin kanssa, joka on julkaistu 4. heinäkuuta. Sen Tongyi-laboratorion kehittämä Websailor on suunniteltu hallitsemaan erittäin monimutkaisia tiedonhakutehtäviä, jotka hämmentävät nykyisiä malleja. Yhtiö väittää, että sen edustaja sulkee suorituskykykuilun johtavien omistusjärjestelmien kanssa kilpailijoilta, kuten OpenAi.

Käyttämällä uutta koulutusmenetelmää, joka on keskittynyt korkean epävarmuusongelmiin, Websailor voi navigoida laajoissa digitaalisissa maisemissa löytääkseen vastauksia, mikä on keskeinen askel kohti "ylimääräisen" päättelyn saavuttamista. Tämä strateginen julkaisu,Saatavana GitHubissa, tavoitteena on vahvistaa Alibaban asema kiihkeästi kilpailukykyisessä avoimen lähdekoodin AI-ekosysteemissä.

Uusi koulutusparadigma monimutkaisesta päättelystä

Websailorin ytimessä on hienostunut koulutusstrategia, jonka tarkoituksena on opettaa malleja, kuinka käsitellä epäselvyyttä. Lähestymistapa siirtyy yksinkertaisen kysymyksenhaltijan ulkopuolelle, keskittyen sen sijaan siihen, mitä tutkijat kutsuvat ”tasolle 3” -ongelmiin: tehtävät ilman selkeää ratkaisua, joka vaatii syvää tutkimusta.

Näiden haasteiden luomiseksi joukkue loiSailorfog-Qa, datasynteesin putkilinja. Se rakentaa monimutkaisia tietokaavioita reaalimaailman verkkosivustoilta ja peittää sitten tietoisesti tietoa-kuten tarkan päivämäärän muuttaminen epämääräisiksi ajanjaksoiksi-pakottaakseen agentin perustelemaan ja yhdistämään erilaisia tosiasioita.

Tavoite,tutkimuspaperion luoda koulutusympäristö, jossa "ihmisen kognitiivisten rajoitusten ylittäminen edustaa kriittistä raja LLM -koulutuksessa". Ryhmä välttää myös suoraan jäljittelemällä opettajamallien sanallista päättelyä. Sen sijaan he rekonstruoivat tiiviin, toimintakeskeiset ajatukset harjoitustiedoista, estäen ”tyylinen saastuminen”.

Näitä tietoja käytetään kaksivaiheisessa koulutusohjelmassa. Se alkaa hylkäämisnäytteenohjaimella (RFT) ”kylmäkäynnistys” perustamistaitojen rakentamiseksi. Tätä seuraa vahvistusoppiminen mukautetun algoritmin avulla, joka kopioi näytteenottopolitiikan optimointia (DUPO), agentin tutkimusstrategioiden tehokkaasti.

Uuden avoimen lähdekoodin vertailuarvo

Alibaban suorituskyvyn väitteet sijainti Websailor uudeksi huipputeknisen avoimen lähdekoodin edustajana. Julkaistujen vertailuarvojen mukaan mallin 72B -versio saavuttaa parhaat pisteet vaikeissa selauskierroksissa sekä englanniksi että kiinaksi.

Suositeltu lukeminen:Google julkistaa Gemini CLI: n, ilmaisen avoimen lähdekoodin AI-koodausagentin

Vertailukohdan kiinalaisessa versiossa Websailor-72B teki 30.1 saavuttaen pariteetin omistusoikeuden aloittajien kanssa, kuten Doubao-Search ja ylittää merkittävästi muiden avoimen lähdekoodin malleja. Englanninkielisessä testissä se teki 12,0. Tutkijat väittävät, että "Websailor ylittää merkittävästi kaikki avoimen lähdekoodin edustajat monimutkaisissa tiedonhakijoiden tehtävissä, vastaavat omistusasteen suorituskykyä ja katkaisemaan kykykuilun."

Alibaba Websailor AI Agent Benchmarks vs. Kilpailijat (lähde: Alibaba)

Merkittävää on, että tulokset viittaavat siihen, että voitot tulevat itse koulutusmenetelmästä. Artikkelissa korostetaan, että vaatimaton Websailor-7B-malli ylittää päättäväisesti paljon suurempiin 32B-malleihin rakennettuja aineita, mikä korostaa uuden paradigman tehokkuutta.

Agentti osoittaa myös voimakasta alaspäin yhteensopivuutta. Huolimatta siitä, että Websailor on koulutettu erittäin vaikeisiin ongelmiin, se ylittää muut menetelmät yksinkertaisemmasta, tosiasiapohjaisesta SimpleQA-vertailuarvosta osoittaen, että sen edistyneet päättelytaidot ovat monipuolisia eikä vaaranna suorituskykyä perustehtävissä.

Navigointi Kiinan kovaa AI -kilpailua

Tätä julkaisua ei ole tyhjiössä. Se laskeutuu kiinalaisen "sadan mallien sodan" keskellä Kiinassa, missä tekniset jättiläiset ovat aggressiivisesti avoimia työntekijöitään markkinaosuuden vangitsemiseksi. Siirtyminen strategisesti asettaa Alibaban johtajana edistyneessä, avoimessa AI -kehityksessä.

Kilpailukykyinen jännitys korostettiin äskettäin, kun tutkimusryhmä väitti, että Huawein uusi Pangu -malli oli kopio Alibaban omasta Qwen -mallista. Huawein laboratorio antoi yrityksen kieltäytymisen, ja sen mallin mukaan ”… ei perustu muiden valmistajien mallien inkrementaaliseen koulutukseen ..." ja kehittyi itsenäisesti.

Tämä intensiivisen kotimaisen kilpailun tausta sisältää suuria toimijoita, kuten Baidu, Ernie -malleillaan ja Tencentillä Hunyuanin kanssa, jotka kaikki kilpailevat määräävästä asemasta. Tätä työntöä lisäävät laajemmat geopoliittiset paineet, koska Yhdysvaltain pakotteet rajoittavat pääsyä ylimmän tason laitteistoihin ja pakottavat kiinalaiset yritykset rakentamaan itseluottavia ekosysteemejä.

Nämä paineet ulottuvat laitteiston ulkopuolelle. Suurimmat kumppanuudet kohtaavat kansainvälisen valvonnan, kuten nähtiin, kun Applen potentiaalinen AI -sopimus Alibaba Drew Backlashin kanssa Washingtonissa kansallisen turvallisuuden huolenaiheista. Tämä pakottaa kiinalaiset tekniset jättiläiset navigoimaan kotimaan kilpailun ja globaalin politiikan monimutkaisessa maisemassa.

Uusi koulutusparadigma monimutkaisesta päättelystä

Uuden avoimen lähdekoodin vertailuarvo

Navigointi Kiinan kovaa AI -kilpailua

Related Posts