OpenAi julkaisee GPT OSS: n 120B & 20B -mallilla avoimen lähdekoodin AI

Openai julkaisi juuri jotain nimeltä GPT OSS, ja rehellisesti, tämä muuttuu paljon. Vietettyään vuosia lukittuihin, suljettuihin AI -työkaluihin, nyt ne ovat kuin "Hei, tässä on jotain mitä voit käyttää."

En todellakaan odottanut tätä, varsinkin kun GPT-5 on nurkan takana. Mutta täällä olemme. He antoivat meille kaksi mallia,GPT OSS-120BjaGPT OSS-20b, ja ne ovat täysin avoimia ja vapaasti käyttää.

Openai pudottaa GPT OSS -malleja, ja se on tavallaan iso juttu

Mainos

Mikä tämä GPT OSS -asia on?

Pohjimmiltaan,Gpt USAon Openain tapa astua takaisin avoimen lähdekoodin maailmaan. Mallit julkaistaan allaApache 2.0 -lisenssi, mikä tarkoittaa, ettei draamaa, ei outoja sääntöjä.

Kuka tahansa voi käyttää sitä, säätää sitä tai rakentaa sitä. Ei ole väliä, oletko yksin kehittäjä vai iso yritys. Nämä mallit ovat vainkielimallit, muuten. Ei kuvia tai ääntä. Vain puhdas teksti.

Miksi sillä on merkitystä

Todellinen syy tähän on iso siirto, että Openai yrittää selvästi voittaa Dev -yhteisön. Viime aikoina on tulossa paljon avoimia malleja, ja jos Openai pysyy suljettuna ikuisesti, ne riskivät jäädä joillekin alueille.

Mainos

NiinGpt USA, He osoittavat, että he välittävät edelleen avoimuudesta ja jakamisesta. Lisäksi se auttaa kaikissa hallitusten ja päätöksentekijöiden painostuksessa, jotka kysyvät jatkuvasti avoimempaa ja selkeämpää AI -kehitystä.

Lisätietoja:Baidun Ernie AI menee avoimen lähdekoodin haasteena Openaille, Kiinan kilpailijoille

Kuinka se toimii

Joten suorituskykyinen, ei ollenkaan huono. Suurempi malli,GPT OSS-120B, kulkee vain huippuluokan Nvidia GPU: lla.

Pienempi,20b, voi kirjaimellisesti ajaa a16 Gt RAM -kannettava tietokone. Se on todella hullua, kun mietit sitä. Se on todellinen saavutettavuus.

He käyttävät jotain nimeltäänUudelleenkoulutuksen (MOE)arkkitehtuuri. Ei aio mennä liian syvälle siihen, mutta pitkä tarina lyhyt, malli ei käytä kaikkia parametrejaan joka kerta. Se valitsee tarvitsemansa osat ja kulkee nopeammin ja kevyemmäksi.

Mainos

Vahvuudet ja kysymykset

PäälleCodeforces -vertailuarvo(jota käytetään taitojen koodaamiseen),GPT OSS-120Bmaalin2622ja 20B -versio teki maalin2516. Melko vankka, ollakseni rehellinen. Vaihtaa muutamia muita malleja, kuten Deepseek R1.

Mutta kyllä, se ei ole täydellinen. Sehallusinaationopeuson tavallaan huono. Iso malli antaa vääriä tietoja kuten49% ajastatosiasiallisesti.

Pienempi pahempaa53%. Se on paljon, mutta sitä odotetaan, koska nämä mallit ovat pienempiä ja niillä ei ole syvää maailman tietämystä, kuten GPT-4.

Pitää se yksinkertaisena,Gpt USAon Openain paluu avoimeen tilaan. Se ei ole täydellinen, mutta se on voimakas, nopea ja helpompi kuin odotit.

Jos olet joku, joka rakentaa tai testaa AI-tavaroita, tämä on hyvä aika hypätä sisään. Päivän lopussa, kyse ei ole GPT-4: n lyömisestä, kyse on ihmisille lähtökohta älykkäämpien työkalujen rakentamiseksi.

Related Posts