Llama 3.1

Meta

Llama 3.1 er Meta's mest avancerede open source AI model serie med størrelser op til 405 milliarder parametre. Flagship 405B modellen konkurrerer med GPT-4 og Claude 3.5, mens den forbliver open source og tilgængelig for alle.

8B, 70B, 405B parametre

Parametre

128K

Kontekst

$0

Input/1K

$0

Output/1K

Capabilities

Opgaver

Avanceret reasoningKodegenereringTekstgenereringMatematisk problemløsningMultilingval opgaverTool useLange dokumenterSyntetisk datagenerering

Sprog Support

EngelskTyskFranskItalienskPortugisiskHindiSpanskThailandsk+2 flere

Styrker

✓Fully open source
✓State-of-the-art for open models
✓405B konkurrerer med GPT-4
✓128K kontekstvindue
✓Kommercielt anvendelig
✓Kan finetuned
✓Native tool use
✓Stærk kodning performance
✓Multilingval

Begrænsninger

!405B kræver massive compute ressourcer
!Mindre modeller er svagere end closed source
!Kræver teknisk ekspertise at deploye
!Hosting costs kan være høje
!Ingen native multimodal

Use Cases

→Research og udvikling

→Custom finetuning

→On-premise deployment

→Kodegenerering

→Syntetisk data generering

→Model distillation

→Privacy-sensitive applikationer

→Academic research

Benchmarks

88.6%

MMLU

86.8%

HellaSwag

89%

HumanEval

96.8%

GSM8K

Tekniske Detaljer

Release Dato: 23.7.2024
Provider: Meta
Parametre: 8B, 70B, 405B parametre
Kontekstvindue: 128,000 tokens
Træningsdata: 15+ trillion tokens frem til december 2023

← Tilbage til alle modeller