NVIDIA: n uudet OpenReasoning-nemotronimallit tekevät edistyneistä AI-päättelystä avoimen kaikille

Nvidia teki juuri suuren muutoksen avoimen lähdekoodin AI: ssa. Viime viikolla yritys julkaisi OpenReasoning-nemotronin. Se on uusi kompakti, mutta tehokas malleja, jotka on suunniteltu monimutkaisille matematiikan, koodien ja luonnontieteiden keskuudessa. Voit tarttua niihin oikeinnyt halaamalla kasvot.

Nämä mallit eivät toimi vain hyvin. He asettavat uusia suorituskykytietueita kokoalueelleen. 32B-versio osuu Pass@1 -pisteeseen 89,2 AIME24: llä ja 70,2: lla LiveCodebenchissä ilman hienosäätöä. Jos otat Genselectin, NVIDIA: n oman lisäystilan, sama malli voi saavuttaa 96,7 HMMT -helmikuu 2025, mikä on järjetöntä korkeaa avoimille malleille.

Mielenkiintoista on, että nämä mallit ovat tislattu Deepseekin 671b R1-0528-jättiläisestä, massiivisesta kiinalaisesta AI-järjestelmästä, jota pidetään saman verran O3: n ja Gemini 2.5 Pro: n kanssa. Nvidia koulutti pienemmät mallit käyttämällä Deepseekin tuottamaa viiden miljoonan päättelynäytteen. Tuloksena on korkean tason päättely niin pienissä kuin 1,5B malleissa, aina 32B: iin.

Kyllä, se on sama syvälle, jonka yhdysvaltalainen parlamentin komitea merkitsi "kansallisen turvallisuuden uhkaa" huhtikuussa. Mutta geopoliittiset jännitteet syrjään, Nvidian julkaisu korostaa, kuinka globaalisti sotkuinen AI -innovaatio todella on.

Kehittäjät eivät enää tarvitse raja-asteikon infrastruktuuria. Nämä mallit toimivat vähemmän resursseja, integroituvat helposti työkaluihin, kuten NEMO ja Tensorrt-LLM, ja ne ovat lisensoitu kaupalliseen käyttöön. Ryhmille, jotka rakentavat perusteluja raskaita sovelluksia, tämä pudottaa esteen pääsylle suurella tavalla.

Liittyvät:Claude 4: n äänitilan avulla voit puhua päiväsi läpi - ja se on ilmainen kaikille

Related Posts