GPT-4o
OpenAIGPT-4o (omni) er OpenAI's mest avancerede multimodale model, der kan forstå og generere tekst, billeder, audio og video. Modellen kombinerer hastighed med intelligens og tilbyder samme niveau af ekspertise som GPT-4 Turbo, men er hurtigere og mere omkostningseffektiv.
Ikke offentliggjort
Parametre
128K
Kontekst
$0.005
Input/1K
$0.015
Output/1K
Capabilities
Opgaver
TekstgenereringKodegenereringBilledforståelse og -genereringAudio forståelseVideo analyseAvanceret reasoningMatematisk problemløsningRealtids konversationMultimodal analyse
Sprog Support
DanskEngelskSpanskFranskTyskItalienskPortugisiskNederlandsk+6 flere
Styrker
- ✓True multimodal - tekst, billede, audio, video
- ✓2x hurtigere end GPT-4 Turbo
- ✓50% billigere end GPT-4 Turbo
- ✓128K kontekstvindue
- ✓Overlegen multilingval performance
- ✓Realtids responsiveness
- ✓Stærk vision capabilities
- ✓Glimrende til kompleks reasoning
Begrænsninger
- !Stadig dyrere end mindre modeller
- !Nogle multimodale features er begrænset i API
- !Cutoff dato i oktober 2023
Use Cases
→Avanceret chatbots med multimodal forståelse
→Video og billedanalyse
→Realtids customer support
→Kodegenerering og review
→Dokumentanalyse med billeder
→Kreativ indholdsproduktion
→Edutech applikationer
→Accessibility tools
Benchmarks
88.7%
MMLU
95.3%
HellaSwag
90.2%
HumanEval
95.8%
GSM8K
Tekniske Detaljer
- Release Dato
- 13.5.2024
- Provider
- OpenAI
- Parametre
- Ikke offentliggjort
- Kontekstvindue
- 128,000 tokens
- Træningsdata
- Data frem til oktober 2023