Kiinan uusi MiniMax M2 -malli haastaa GPT-5:n ja Claude 4.5:n ultratehokkuudella, huippusuorituskyvyllä ja alhaisella hinnalla

Kiinalainen AI-startup MiniMax on julkaissut uuden avoimen lähdekoodin mallin. Shanghaissa toimiva MiniMax lanseerasi MiniMax-M2:n maanantaina. Sen tavoitteena on ravistaa tekoälymarkkinoita sekä hinnalla että teholla. MiniMax sanoo, että M2 kilpailee huippumalleja, kuten Anthropicin Claude Sonnet 4.5. Se on kuitenkin vain 8 % kustannuksista.

Malli on rakennettu tekoälyagenteille ja koodaukselle. Sen älykäs suunnittelu käyttää vain 10 miljardia aktiivista parametria. Tämä pitää kustannukset alhaisina ja nopeudet korkealla. Julkaisu asettaa MiniMaxin suoraan kilpailemaan länsimaisten jättiläisten ja paikallisen kilpailijan DeepSeekin kanssa kasvavista kehittäjämarkkinoista.

Uusi suorituskyvyn ja tehokkuuden vertailukohta

Kiinalaisten teknologiajättiläisten Alibaban ja Tencentin tukema MiniMax asettaa M2-mallinsa uudeksi johtajaksi avoimen lähdekoodin avaruudessa.

MiniMax väittää tarjoavansa huippusuorituskykyä, joka on räätälöity seuraavan sukupolven tekoälysovelluksiin.

"MiniMax-M2 määrittelee agenttien tehokkuuden uudelleen. Se on kompakti, nopea ja kustannustehokas MoE-malli, joka on rakennettu huippusuorituskykyyn koodaus- ja agenttitehtävissä, samalla kun se säilyttää tehokkaan yleisen älykkyyden", toteaamallin viralliset asiakirjat.

Sen keskittyminen agenttitehtäviin – joissa tekoälyn on suunniteltava, toimittava ja tarkistettava monimutkaisia ​​työnkulkuja – on suunnattu merkittävälle kasvualueelle ohjelmistoteollisuudessa siirtymällä yksinkertaisen keskustelun tekoälyn lisäksi järjestelmiin, jotka voivat suorittaa monimutkaisia ​​tehtäviä itsenäisesti.

VertailuarvoMiniMax-M2Claude Sonnetti 4Claude Sonnetti 4.5Gemini 2.5 ProGPT-5 (ajatellen)GLM-4.6Kuten K2 0905DeepSeek-V3.2
SWE-penkki Verified69.472,7 *77,2 *63,8*74,9 *68 *69,2 *67,8 *
Multi-SWE-penkki36.235,7 *44.3//3033.530.6
SWE-penkki Monikielinen56.556,9 *68//53.855,9 *57,9 *
Terminaali-penkki46.336,4 *50 *25,3 *43,8 *40,5*44,5 *37,7 *
ArtefactsBench66.857,3*61.557,7*73*59.854.255.8
BrowseComp4412.219.69.954,9*45,1*14.140.1*
SelaaComp-zh48.529.140.832.26549.528.847,9*
GAIA (vain teksti)75.768.371.260.276.471.960.263.5
xbench-DeepSearch7264.6665677.8706171
HLE (työkaluilla)31.820.324.528,4 *35,2 *30,4 *26,9 *27,2 *
τ²-penkki77.265,5*84,7*59.280.1*75,9*70.366.7
FinSearchComp-globaali65.54260.842,6*63,9*29.229,5*26.2
AgentCompany36374139,3*/353034

Lähde: MiniMax

Riippumaton testaus tukee näitä väitteitä. Kolmannen osapuolen vertailuarvot alkaenKeinotekoinen analyysisijoittaa MiniMax-M2:n maailmanlaajuisen älykkyyden viiden parhaan joukkoon, ansaitsemalla sille 61 %.

Tämä sijoitus asettaa sen kilpailijoiden, kuten Googlen Gemini 2.5 Pron (60 %) edelle ja Anthropicin Claude Sonnetin 4.5:n (63 %) edelle.

Kehittäjille tämä tarkoittaa pääsyä tehokkaaseen, avoimeen malliin, joka pystyy käsittelemään kehittyneitä koodauksia ja työkalujen käyttöskenaarioita ilman, että se on lukittunut omaan ekosysteemiin.

"Mahdoton kolmio": tasapainottaa tehoa, nopeutta ja kustannuksia

Vuosien ajan kehittäjät ovat kohdanneet kompromissin mallin älykkyyden, päättelynopeuden ja käyttökustannusten välillä – "mahdoton kolmio".

MiniMax väittää, että M2 vastaa suoraan tähän haasteeseen.

"Olemme tutkineet, onko mahdollista luoda malli, joka saavuttaa paremman tasapainon suorituskyvyn, hinnan ja nopeuden välillä, jolloin useammat ihmiset voivat hyötyä agenttien aikakauden älykkyydestä", tiimi totesi.blogikirjoitus.

Avain tähän tasapainoon on mallin arkkitehtuuri, joka asettaa etusijalle laskennallisen säästämisen kyvykkyydestä tinkimättä.

Rakentamalla Mixture-of-Experts (MoE) -arkkitehtuuriin M2 hyödyntää 230 miljardin kokonaisparametrin valtavaa poolia, mutta aktivoi vain 10 miljardia mihin tahansa tehtävään teknisten määritystensä mukaisesti.

M2 on huomattavasti tehokkaampi kuin kilpailevat mallit, kuten DeepSeek's, joka aktivoi 37 miljardia parametria per merkki.

Tämä arkkitehtoninen valinta vähentää dramaattisesti laskennallisia lisäkustannuksia ja muistivaatimuksia, mikä johtaa suoraan alhaisempiin käyttökustannuksiin ja nopeampiin vasteaikoihin.

Taloudelliset vaikutukset voivat olla dramaattisia. MiniMax on asettanut API-hinnaksi vain 0,30 dollaria miljoonalta syöttötunnisteelta ja 1,20 dollariksi miljoonalta lähtötunnisteelta.

Tämä aggressiivinen hinnoittelu on noin 8 % Claude 3.5 Sonnetin hinnasta, kun taas MiniMax väittää, että M2 tarjoaa lähes kaksinkertaisen päättelynopeuden.

Tällä tehokkuudella on syvällinen vaikutus tekoälyagenttien kehitykseen, jossa nopeammat ja halvemmat prosessointisilmukat mahdollistavat herkempiä ja monimutkaisempia työnkulkuja, mikä tekee kehittyneistä tekoälytyökaluista helpommin saavutettavia ja skaalautuvia kuin koskaan ennen.

Kiinan avoimen lähdekoodin hyökkäys jatkuu

MiniMax on asettanut M2-mallin painot täysin saataville kehittäjäalustalla, mikä vahvistaa Kiinan johtajuutta avoimen lähdekoodin tekoälyavaruudessa.Halaavat kasvot.

MiniMax jatkaa muiden kiinalaisten yritysten, kuten DeepSeekin, luomaa trendiä, jotka ovat aggressiivisesti harjoittaneet avoimen lähdekoodin strategiaa rakentaakseen yhteisöä, edistääkseen maailmanlaajuista käyttöönottoa ja kilpaillakseen Yhdysvaltojen ja Kiinan kiihkeän teknologiasodan keskellä.

Avoin lähdekoodi tarjoaa strategisen tien eteenpäin laitteistorajoituksista selviytyville yrityksille, jolloin ne voivat kilpailla innovaatioiden ja kustannusten suhteen.

Tämä strategia asettaa MiniMaxin suoraan kilpailuun kotimaisen kilpailijansa kanssa, joka on kiihtynyt jo jonkin aikaa.

Aiemmin tänä vuonna MiniMax julkaisi M1-mallinsa nimenomaan haastaakseen DeepSeekin hallitsevan aseman päättelymallitilassa korostaen sallivampaa Apache 2.0 -lisenssiä keskeisenä erottajana.

M2:n julkaisu ajaa tätä kilpailua entisestään kohdentamalla samalle kehittäjäyhteisölle houkuttelevan tarjouksen ylivertaisesta suorituskyvystä halvemmalla.

"MiniMaxin julkaisu jatkaa kiinalaisten tekoälylaboratorioiden johtajuutta avoimessa lähdekoodissa, jonka DeepSeek aloitti vuoden 2024 lopulla ja jota ovat jatkaneet jatkuvat DeepSeek-julkaisut, Alibaba, Z AI ja Moonshot AI",totesiKeinotekoinen analyysi.

Julkaisu on osa laajempaa innovaatiomallia yhtiöltä, jolla on monipuolinen portfolio, joka sisältää videoiden luontityökaluja ja joka on aiemmin asettanut vertailuarvoja malleille, joissa on ennätykselliset 4 miljoonan tokenin kontekstiikkunat.

Lue lisää:Antrooppiset haasteet Microsoft Copilotin "Claude for Excel" -julkaisulla

MiniMaxin keskittyminen avoimen lähdekoodin tehokkaisiin malleihin on merkki strategisesta pyrkimyksestä valloittaa merkittävä osuus markkinoista. Ratkaisemalla kriittisen tehon, nopeuden ja kustannusten tasapainon M2-malli ei ainoastaan ​​haasta vakiintunutta järjestystä, vaan tarjoaa kehittäjille maailmanlaajuisesti tehokkaan uuden työkalun seuraavan sukupolven tekoälypohjaisten sovellusten rakentamiseen.

Related Posts