Llama 3.1

Meta

Llama 3.1 er Meta's mest avancerede open source AI model serie med størrelser op til 405 milliarder parametre. Flagship 405B modellen konkurrerer med GPT-4 og Claude 3.5, mens den forbliver open source og tilgængelig for alle.

8B, 70B, 405B parametre

Parametre

128K

Kontekst

$0

Input/1K

$0

Output/1K

Capabilities

Opgaver

Avanceret reasoningKodegenereringTekstgenereringMatematisk problemløsningMultilingval opgaverTool useLange dokumenterSyntetisk datagenerering

Sprog Support

EngelskTyskFranskItalienskPortugisiskHindiSpanskThailandsk+2 flere

Styrker

  • Fully open source
  • State-of-the-art for open models
  • 405B konkurrerer med GPT-4
  • 128K kontekstvindue
  • Kommercielt anvendelig
  • Kan finetuned
  • Native tool use
  • Stærk kodning performance
  • Multilingval

Begrænsninger

  • !405B kræver massive compute ressourcer
  • !Mindre modeller er svagere end closed source
  • !Kræver teknisk ekspertise at deploye
  • !Hosting costs kan være høje
  • !Ingen native multimodal

Use Cases

Research og udvikling
Custom finetuning
On-premise deployment
Kodegenerering
Syntetisk data generering
Model distillation
Privacy-sensitive applikationer
Academic research

Benchmarks

88.6%
MMLU
86.8%
HellaSwag
89%
HumanEval
96.8%
GSM8K

Tekniske Detaljer

Release Dato
23.7.2024
Provider
Meta
Parametre
8B, 70B, 405B parametre
Kontekstvindue
128,000 tokens
Træningsdata
15+ trillion tokens frem til december 2023