Pasienio AI modeliams, kai lyja, lyja. Trečiadienį „Mistral“ išleido naują pavyzdinį modelį „Large 2“, kuris, kaip teigiama, prilygsta naujausiems OpenAI ir Meta modeliams kodų generavimo, matematikos ir samprotavimo prasme.
„Mistral Large 2“ išleidžiama tik vieną dieną po to, kai „Meta“ atsisakė naujausio ir geriausio atvirojo kodo modelio „Llama 3.1 405b“. „Mistral“ teigia, kad „Large 2“ pakelia atvirų modelių našumo ir sąnaudų kartelę, pagrįsdama tai keliais etalonais.
Atrodo, kad Large 2 lenkia Llama 3.1 405B pagal kodų generavimą ir matematinį našumą ir tai daro su mažiau nei trečdaliu parametrų: tiksliau, 123 mlrd.
Pranešime spaudai „Mistral“ sako, kad viena iš svarbiausių treniruočių krypčių buvo modelio haliucinacijų problemų mažinimas. Bendrovė teigia, kad „Large 2“ buvo išmokyta būti įžvalgesniems savo atsakymuose, pripažinti, kai ko nors nežino, užuot sugalvoję ką nors, kas atrodo tikėtina.
Paryžiuje įsikūręs DI startuolis neseniai surinko 640 mln. USD B serijos finansavimo etape, kuriam vadovavo „General Catalyst“, už 6 mlrd. Nors „Mistral“ yra vienas iš naujesnių dirbtinio intelekto erdvės dalyvių, jis greitai pristato dirbtinio intelekto modelius pažangiausiuose arba šalia jų.
Tačiau svarbu pažymėti, kad „Mistral“ modeliai, kaip ir dauguma kitų, nėra atvirojo kodo tradicine prasme – bet kokiam komerciniam modelio pritaikymui reikalinga mokama licencija. Ir nors jis yra atviresnis nei, tarkime, GPT-4o, retas pasaulyje turi patirties ir infrastruktūros tokiam dideliam modeliui įgyvendinti. (Žinoma, tai dvigubai atitinka 405 milijardus Lamos parametrų.)
Kažko trūko Mistral Large 2 ir kurio vakar nebuvo Meta's Llama 3.1 leidime, yra multimodalinės galimybės. „OpenAI“ gerokai lenkia konkurentus dėl daugiarūšių AI sistemų, galinčių vienu metu apdoroti vaizdą ir tekstą.
Modelis turi 128 000 žetonų langą, o tai reiškia, kad Large 2 gali gauti daug duomenų vienu raginimu (128 000 žetonų prilygsta maždaug 300 puslapių knygai). Naujasis „Mistral“ modelis taip pat apima patobulintą daugiakalbį palaikymą. Didelis 2 supranta anglų, prancūzų, vokiečių, ispanų, italų, portugalų, arabų, hindi, rusų, kinų, japonų ir korėjiečių kalbas, taip pat 80 kodavimo kalbų. Pažymėtina, kad „Mistral“ teigia, kad „Large 2“ taip pat pateikia glaustesnius atsakymus nei pirmaujantys AI modeliai, kurie yra linkę plepėti.
„Mistral Large 2“ galima naudoti „Google Vertex AI“, „Amazon Bedrock“, „Azure AI Studio“ ir IBM watsonx.ai. Taip pat galite naudoti naująjį modelį „Mistral's le Plateforme“ pavadinimu „mistral-large-2407“ ir nemokamai išbandyti startuolio „ChatGPT“ konkurente „le Chat“.