Mitä GPT -5: n ”uusi matematiikka” -vaatimus todella tarkoittaa?

”Uusi matematiikka” on ladattu lause. Tässä tapauksessa se viittaa väitteeseen, jonka mukaan GPT -5 Pro tuotti oikean, aikaisemmin julkaisemattoman todisteen, joka paransi kuperan optimointituloksen tunnettua sitoutumista - vakiona siirtäminen1/L-lla1.5/Lsamojen oletusten puitteissa. Väite tulee OpenAi -tutkijan sosiaalisesta viestistä, joka kuvaa kuinka malli ”ajatteli” noin 17 minuuttia ja tuotti tuloksen. Se on herättänyt jännitystä ja skeptisyyttä yhtä suuressa määrin.

GPT-5 teki vain satunnaisesti uuden matematiikan.

Ehdotettu lukeminen:Mitä Kekw tarkoittaa Twitch -chatissa ja mistä se syntyi?

Sebastien Bubeck antoi sille avoimen ongelman kuperasta optimoinnista, jota ihmiset olivat vain osittain ratkaistu. GPT-5-Pro ​​istui, perusteltu 17 minuutiksi ja tuotti oikean todisteen, joka paransi tunnetun sidoksen 1/l aina ... https://t.co/Knezv7jr7dpic.twitter.com/qj3pdzktzh

- Vraserx E/ACC (@VRaserx)20. elokuuta 2025

Mitä väitettiin olevan todistettu?

Tehtävä sisälsi tuloksen kuperan optimoinnissa - kentällä, joka tutkii kuinka minimoida tehokkaasti ”hyvin käyttäytyneet” toiminnot. Monet tämän alueen takuut riippuvat sileysvakioista, usein kirjoitettunaL. Yleinen teema on todistaa, kuinka suuri ”turvallinen” askelkoko voi olla (ajattele kuinka pitkälle voit liikkua kaltevuuden laskeutumisella ja edistää silti luotettavaa).

Väitteen mukaan GPT -5 Pro tiukensi olemassa olevaa takuuta parantamalla vakiokerrointa1/L-lla1.5/Lmuuttamatta taustalla olevia oletuksia. Selkeästi: Malli ehdotti matemaattisesti pätevää tapaa antaa algoritmin suorittaa suurempia askeleita pysyen samalla sääntöjen mukaisesti. Se olisi ei -triviaalista hienostuneisuutta - ei suurta yhdistämistä, mutta ei myöskään triviaalia aritmeettista.

Oliko se todella ”uusi” - ja onko se paras tulos?

Tässä vivahteilla on merkitystä. Parannus1.5/Lkuvataan olevan kopioitu mistään ja verkkotunnuksen asiantuntija tarkistaa. Myöhempi ihmistyö saavutti kuitenkin vielä tiukemman sidotun1.75/Lsaman tutkimuslinjan myöhemmässä versiossa. Ajoitus ja kehystys ovat osa keskustelua: Jotkut tarkkailijat huomauttavat, että voimakkaampi ihmisen tulos ilmestyi julkisesti aikaisemmin kuin sosiaalinen viesti viittaa, kun taas kannattajat vastustivat sitä, että GPT -5: n todistusstrategia erottui, ja siksi sitä pidetään edelleen uutena.

Kaksi avainpistettä voivat olla totta: mallin todiste voi olla oikea ja alkuperäinen tekniikassaan, eikä se välttämättä ole vahvin tunnetuksi sidottu. Matematiikassa uutuus on kyse siitä, onko tietty argumentti tai tulos aikaisemmin kirjoitettu, ei siitä, onko se paras mahdollinen sidottu ikuisesti.

Kuinka LLM voisi tehdä tämän?

Openai asettaa GPT -5: n merkittävänä päättelyn päivityksenä, mukaan lukien matematiikka. Yhtiön käynnistämismateriaalissaan GPT -5 asettaa uusia merkkejä matematiikan vertailuarvoihin ja "tietää milloin reagoida nopeasti ja milloin ajatella pidempään", yhtenäisen järjestelmän ansiosta, joka reitittää vaikeampaa ongelmia syvemmälle päättelytilaan. Nämä väitteet esitetään Openain GPT -5 -ilmoituksessa ja tuotesivulla, joka kuvaa parannuksia oikeellisuudessa, vähentyneissä hallusinaatioissa ja korkeammat pisteet AIME: n ja GPQA: n kaltaisissa kilpailuissa.

Jopa näiden parannusten kanssa, suuri kielimalli ei "tee matematiikkaa" kuin ihminen. Se tuottaa symbolisia argumentteja yhdistämällä sen oppimat kuviot, joskus laajennetulla ”ajattelulla” siirtyy rakenteelle monivaiheinen päättely. Se voi olla tarpeeksi kootakseen pätevän todisteen tietylle markkinarakolle - varsinkin kun mallia ohjaa äskettäinen asiakirja ja selkeä, rajoitettu kysyntä, kuten "parantaa vakioa samoissa oletuksissa".

Mikä tekee väitteestä kiistanalaisen?

Kolme asiaa:

  • Provenance.On suoraviivaista varmistaa, onko todiste oikea; On paljon vaikeampaa varmistaa, että malli tuotti sen itsenäisesti ilman raskasta ihmisen ohjausta tai hakua jostakin epäselvästä.
  • Aikajana ja kehystys.Kriitikot väittävät, että sosiaalinen viesti yliarvioi tuloksen "raja -edistävän" luonteen, koska ihmisillä oli jo vahvempi sidottu. Kannattajat sanovat, että mallin todiste oli edelleen uusi ja aineellisesti erilainen.
  • Toistettavuus.Jotkut ihmiset ilmoittavat, että nykyisten mallien pyytäminen toistamaan feat tuottaa vääriä tai epäjohdonmukaisia ​​vastauksia. Yhden off -tapahtuma tapahtuu; Luotettava kyky on viime kädessä merkitystä.

Kuinka arvioida tällaisia ​​väitteitä

Jos yrität ymmärtää samanlaisia ​​"AI teki uusia matematiikka" -ilmoituksia, käytä samoja suodattimia, jotka työskentelevät matemaatikot:

  • Tarkista todiste. Jos se on julkista, asiantuntijat voivat vahvistaa oikeellisuuden nopeasti. Hienovaraiset virheet ovat yleisiä automaattisesti luotuissa argumenteissa, joten ulkopuoliset tarkistusasiot.
  • Vertaa aktiiviseen taidetta. Oliko sama sidottu (tai parempi) jo todistettu? Jos on, onko uusi todistustekniikka merkityksellisesti erilainen?
  • Testi toistettavuus. Voidaanko tulos palauttaa samalla keholla ja mallilla? Yleistyykö se samanlaisia ​​ongelmia vai onko se yksi?
  • Kysynnän läpinäkyvyys. Hyödyllinen näyttö sisältää tarkan kehotuksen riippumatta siitä, onko mallilla työkalujen käyttö tai verkkohaku käytössä ja käytetty malli/versio.
  • Erillinen "romaani" "Hyödyllisestä". Todiste voi olla teknisesti uusi, mutta asteittainen; Se voi olla myös heikompi kuin olemassa olevat tulokset ja silti olla mielenkiintoinen, jos menetelmä on tuore.

Onko AIS: n myötävaikuttanut matematiikkaan ja algoritmeihin aiemmin?

Kyllä - vaikka usein ei niin puhdasta tekstiä. Google DeepMind on esittänyt järjestelmiä, jotka löytävät tai hienosäätävät algoritmeja agenttisillä silmukoilla ja sekoituksessa varmennuksella. Esimerkiksi yritys kertoi, kuinka Gemini -voima -agentti nimeltään Alphaovolve iteratiivisesti suunnittelee algoritmisia ideoita, jotka sitten tarkistetaan, parannetaan ja valitaan ympäröivällä järjestelmällä; Voit lukea lähestymistavan Deepmindin virallisessa blogissa. Nämä putkilinjat näyttävät vähemmän chat -kopiolta ja enemmän kuin laboratorio: Luo ideoita, tarkista, korjata, toista.

Joten, onko tämä iso juttu?

Jos GPT -5 Pro tuotti todellakin oikean minuutin tunnettujen tulosten vahvistamattoman, julkaisemattoman vahvistamisen, se on huomionarvoista - ei siksi, että se "keksi matematiikkaa", vaan koska se vihjaa LLM: ien käytännöllistä roolia väsymättöminä tutkimusavustajina, jotka kiristävät vakioita, kokeile vaihtoehtoisia todisteita ja pinta -alaista tarkennuksia tarpeen mukaan. Openain omat materiaalit korostavat pyrkimystä kohti parempaa päättelyä ja vähemmän hallusinaatioita. GPT -5 -reititys kovat tehtävät laajennetuksi ajatteluun ja pisteet korkeammalle matematiikan vertailuarvoille kuin aiemmat mallit, kuten sen käynnistysviestissä esitetään.

Varoitus on sama kuin aina: yksi vaikuttava anekdootti ei ole kyky. Tärkeää on, voivatko riippumattomat tutkijat rutiininomaisesti saada aikaan vertailukelpoisia, todentavasti oikeita ja selvästi uusia tuloksia - mieluiten täysin julkistetuilla kehotuksilla ja asetuksilla.

Keskeiset ehdot, selitetty lyhyesti

  • Convex optimization: Optimoinnin haara, jossa objektiivifunktiolla on yksi globaali minimi eikä harhaanjohtava paikallinen minimiä, mikä mahdollistaa vahvat teoreettiset takuut.
  • L-smoothness (L): Ehto, joka rajoittaa kuinka nopeasti gradientti voi muuttua; Se rajoittaa turvallisia askelkokoja menetelmille, kuten gradientin laskeutuminen.
  • Bound tightening: Jatkuvan parantaminen (esim.1/L-lla1.5/L) Lauseella pitäen samalla samat oletukset - usein herkät, joskus vaikuttavat.
  • Reasoning mode: GPT -5: ssä syvempi ”ajattele pidempi” polku, johon järjestelmä voi reitittää monimutkaisten tehtävien varalta; Se on osa yhtenäistä mallia, jonka Openai on kuvaillut sen virallisella GPT -5 -sivulla.

Bottom line: väittää, että malli teki ”uusi matematiikka” kuulustella - mutta sitä ei hylätä käsistä. GPT -5: n avulla OpenAi on nimenomaisesti kohdistettu vaikeampaa päättelyä ja matematiikan suorituskykyä järjestelmässä, joka voi päättää, milloin kuluttaa enemmän ongelmaa. Jos syntyy luotettavia työnkulkuja, joissa malli ehdottaa ehdokastodistuksia ja ihmisiä tai työkaluja, vahvistavat ne, vakioiden kiristäminen ja todistevarianttien tutkiminen voi tulla tuottava ihmis -AI -yhteistyö - vähemmän ”matemaatikkojen korvaaminen”, mikä antaa heille enemmän nopeampaa tapaa testata ideoita.

Related Posts