Meta har lagt till två nya språkliga modeller till hans serie: Lama 3 8B e Lama 3 70B. Dessa lovar överlägsen prestanda i världen av artificiell intelligens. Den mest slående nyheten? Närvaron av 8 miljarder respektive 70 miljarder parametrar. Dessa siffror representerar komplexiteten och förmågan hos modellen att hantera och att bearbeta Informazioni.
Llama 3 är inte bara två modeller: mer material är på väg
Meta slutar inte där; planerar att släpp fler modeller i Llama 3-serien, men utan att ange ett datum. Denna strategi skapar förväntan och visar också företagets engagemang för att ständigt förbättra sina erbjudanden.
I nya Llama-modeller de beskrivs som ett språng från tidigare modeller. Denna förbättring beror delvis på användningen av två anpassade GPU-kluster, var och en med 24.000 XNUMX enheter, vilket gjorde att modellerna kunde tränas mer effektivt och exakt. Meta hävdar att dessa modeller är det på grund av antalet parametrar de har bland de bästa som finns idag för generativ artificiell intelligens.
Llama 3:s prestanda mättes genom olika AI-riktmärken, som är standardiserade tester som används för att utvärdera AI-modellernas kapacitet. Dessa inkluderar MMLU för kunskap, BÅGE för förvärv av kompetens, t.ex FALLA för resonemang om textblock. Även om det finns olika åsikter om användbarheten av dessa riktmärken, är de fortfarande en vanlig metod för att utvärdera och jämföra AI-modellernas förmåga.
Framför allt överträffade Llama 3 8B liknande modeller med öppen källkod med färre parametrar, som Mistral och Google Gemma, i minst nio olika riktmärken. Detta inkluderar tester på allmän kunskap, resonemang och specifika färdigheter inom områden som biologi, fysik, kemi och till och med kodgenerering och matematiska problem. Vilket GPT-4 till exempel inte kan göra särskilt bra.
Den största modellen, Llama 3 70B, konkurrerar inte bara utan överträffar i vissa fall flaggskeppsmodeller som t.ex. Gemini 1.5 Pro från Google i olika tester som visar att den trots stark konkurrens kan stå emot även branschens jättar. Det är dock viktigt att notera att medan den överträffar vissa flaggskeppsmodeller som t.ex Claude 3 Sonnet av Anthropic i flera tester når den inte prestanda hos den mer avancerade Claude 3 Opus-modellen.