Llama 3.1
MetaLlama 3.1 er Meta's mest avancerede open source AI model serie med størrelser op til 405 milliarder parametre. Flagship 405B modellen konkurrerer med GPT-4 og Claude 3.5, mens den forbliver open source og tilgængelig for alle.
8B, 70B, 405B parametre
Parametre
128K
Kontekst
$0
Input/1K
$0
Output/1K
Capabilities
Opgaver
Avanceret reasoningKodegenereringTekstgenereringMatematisk problemløsningMultilingval opgaverTool useLange dokumenterSyntetisk datagenerering
Sprog Support
EngelskTyskFranskItalienskPortugisiskHindiSpanskThailandsk+2 flere
Styrker
- ✓Fully open source
- ✓State-of-the-art for open models
- ✓405B konkurrerer med GPT-4
- ✓128K kontekstvindue
- ✓Kommercielt anvendelig
- ✓Kan finetuned
- ✓Native tool use
- ✓Stærk kodning performance
- ✓Multilingval
Begrænsninger
- !405B kræver massive compute ressourcer
- !Mindre modeller er svagere end closed source
- !Kræver teknisk ekspertise at deploye
- !Hosting costs kan være høje
- !Ingen native multimodal
Use Cases
→Research og udvikling
→Custom finetuning
→On-premise deployment
→Kodegenerering
→Syntetisk data generering
→Model distillation
→Privacy-sensitive applikationer
→Academic research
Benchmarks
88.6%
MMLU
86.8%
HellaSwag
89%
HumanEval
96.8%
GSM8K
Tekniske Detaljer
- Release Dato
- 23.7.2024
- Provider
- Meta
- Parametre
- 8B, 70B, 405B parametre
- Kontekstvindue
- 128,000 tokens
- Træningsdata
- 15+ trillion tokens frem til december 2023