GPT-4o

OpenAI

GPT-4o (omni) er OpenAI's mest avancerede multimodale model, der kan forstå og generere tekst, billeder, audio og video. Modellen kombinerer hastighed med intelligens og tilbyder samme niveau af ekspertise som GPT-4 Turbo, men er hurtigere og mere omkostningseffektiv.

Ikke offentliggjort

Parametre

128K

Kontekst

$0.005

Input/1K

$0.015

Output/1K

Capabilities

Opgaver

TekstgenereringKodegenereringBilledforståelse og -genereringAudio forståelseVideo analyseAvanceret reasoningMatematisk problemløsningRealtids konversationMultimodal analyse

Sprog Support

DanskEngelskSpanskFranskTyskItalienskPortugisiskNederlandsk+6 flere

Styrker

  • True multimodal - tekst, billede, audio, video
  • 2x hurtigere end GPT-4 Turbo
  • 50% billigere end GPT-4 Turbo
  • 128K kontekstvindue
  • Overlegen multilingval performance
  • Realtids responsiveness
  • Stærk vision capabilities
  • Glimrende til kompleks reasoning

Begrænsninger

  • !Stadig dyrere end mindre modeller
  • !Nogle multimodale features er begrænset i API
  • !Cutoff dato i oktober 2023

Use Cases

Avanceret chatbots med multimodal forståelse
Video og billedanalyse
Realtids customer support
Kodegenerering og review
Dokumentanalyse med billeder
Kreativ indholdsproduktion
Edutech applikationer
Accessibility tools

Benchmarks

88.7%
MMLU
95.3%
HellaSwag
90.2%
HumanEval
95.8%
GSM8K

Tekniske Detaljer

Release Dato
13.5.2024
Provider
OpenAI
Parametre
Ikke offentliggjort
Kontekstvindue
128,000 tokens
Træningsdata
Data frem til oktober 2023