Qwen 2

Qwen (Alibaba)

Qwen 2 er Alibaba's nye generation af open source language models med størrelser fra 0.5B til 72B parametre. Modellen exceller i kinesisk, kodning og matematik med state-of-the-art performance for open models.

0.5B, 1.5B, 7B, 57B, 72B parametre

Parametre

33K

Kontekst

$0

Input/1K

$0

Output/1K

Capabilities

Opgaver

TekstgenereringKodegenereringMatematisk problemløsningReasoningKinesisk NLPMultilingval opgaverAnalyseKreativ skrivning

Sprog Support

Kinesisk (Simplified og Traditional)EngelskSpanskFranskTyskJapanskKoreanskArabisk+3 flere

Styrker

  • Best-in-class kinesisk performance
  • Stærk i kodning og matematik
  • Multiple størrelser til forskellige behov
  • Open source med kommerciel licens
  • 32K kontekstvindue
  • Effektiv inference
  • Alibaba Cloud integration
  • Solid multilingual

Begrænsninger

  • !Mindre kendt uden for Asien
  • !Dokumentation primært på kinesisk
  • !Færre vestlige integrationer
  • !Community primært kinesisk

Use Cases

Kinesiske AI applikationer
E-commerce (Alibaba ecosystem)
Asiatiske markeder
Bilingual support
Kodegenerering i Kina
Research i Asien
Cross-cultural AI
On-device AI (små modeller)

Benchmarks

84.2%
MMLU
87%
HellaSwag
79.9%
HumanEval
89.5%
GSM8K

Tekniske Detaljer

Release Dato
6.6.2024
Provider
Qwen (Alibaba)
Parametre
0.5B, 1.5B, 7B, 57B, 72B parametre
Kontekstvindue
32,768 tokens
Træningsdata
7T tokens (multilingual med fokus på kinesisk)