Qwen 2
Qwen (Alibaba)Qwen 2 er Alibaba's nye generation af open source language models med størrelser fra 0.5B til 72B parametre. Modellen exceller i kinesisk, kodning og matematik med state-of-the-art performance for open models.
0.5B, 1.5B, 7B, 57B, 72B parametre
Parametre
33K
Kontekst
$0
Input/1K
$0
Output/1K
Capabilities
Opgaver
TekstgenereringKodegenereringMatematisk problemløsningReasoningKinesisk NLPMultilingval opgaverAnalyseKreativ skrivning
Sprog Support
Kinesisk (Simplified og Traditional)EngelskSpanskFranskTyskJapanskKoreanskArabisk+3 flere
Styrker
- ✓Best-in-class kinesisk performance
- ✓Stærk i kodning og matematik
- ✓Multiple størrelser til forskellige behov
- ✓Open source med kommerciel licens
- ✓32K kontekstvindue
- ✓Effektiv inference
- ✓Alibaba Cloud integration
- ✓Solid multilingual
Begrænsninger
- !Mindre kendt uden for Asien
- !Dokumentation primært på kinesisk
- !Færre vestlige integrationer
- !Community primært kinesisk
Use Cases
→Kinesiske AI applikationer
→E-commerce (Alibaba ecosystem)
→Asiatiske markeder
→Bilingual support
→Kodegenerering i Kina
→Research i Asien
→Cross-cultural AI
→On-device AI (små modeller)
Benchmarks
84.2%
MMLU
87%
HellaSwag
79.9%
HumanEval
89.5%
GSM8K
Tekniske Detaljer
- Release Dato
- 6.6.2024
- Provider
- Qwen (Alibaba)
- Parametre
- 0.5B, 1.5B, 7B, 57B, 72B parametre
- Kontekstvindue
- 32,768 tokens
- Træningsdata
- 7T tokens (multilingual med fokus på kinesisk)