GPT-4o

OpenAI

GPT-4o (omni) er OpenAI's mest avancerede multimodale model, der kan forstå og generere tekst, billeder, audio og video. Modellen kombinerer hastighed med intelligens og tilbyder samme niveau af ekspertise som GPT-4 Turbo, men er hurtigere og mere omkostningseffektiv.

Foto: Markus Spiske / Unsplash

Ikke offentliggjort

Parametre

128K

Kontekst

$0.005

Input/1K

$0.015

Output/1K

Capabilities

Opgaver

TekstgenereringKodegenereringBilledforståelse og -genereringAudio forståelseVideo analyseAvanceret reasoningMatematisk problemløsningRealtids konversationMultimodal analyse

Sprog Support

DanskEngelskSpanskFranskTyskItalienskPortugisiskNederlandsk+6 flere

Styrker

✓True multimodal - tekst, billede, audio, video
✓2x hurtigere end GPT-4 Turbo
✓50% billigere end GPT-4 Turbo
✓128K kontekstvindue
✓Overlegen multilingval performance
✓Realtids responsiveness
✓Stærk vision capabilities
✓Glimrende til kompleks reasoning

Begrænsninger

!Stadig dyrere end mindre modeller
!Nogle multimodale features er begrænset i API
!Cutoff dato i oktober 2023

Use Cases

→Avanceret chatbots med multimodal forståelse

→Video og billedanalyse

→Realtids customer support

→Kodegenerering og review

→Dokumentanalyse med billeder

→Kreativ indholdsproduktion

→Edutech applikationer

→Accessibility tools

Benchmarks

88.7%

MMLU

95.3%

HellaSwag

90.2%

HumanEval

95.8%

GSM8K

Tekniske Detaljer

Release Dato: 13.5.2024
Provider: OpenAI
Parametre: Ikke offentliggjort
Kontekstvindue: 128,000 tokens
Træningsdata: Data frem til oktober 2023

← Tilbage til alle modeller