Retrieval-Augmented Generation (RAG)
AdvancedAdvanced Reasoning
RAG kombinerer information retrieval med generering. Modellen henter relevant information fra en ekstern kilde (f.eks. database eller dokumenter) og bruger denne til at generere mere præcise, faktuelle svar.
Eksempel
Prompt:
Baseret på følgende dokumenter, besvar spørgsmålet: Dokument 1: 'Virksomheden havde en omsætning på 45 mio kr i 2023' Dokument 2: 'Driftsomkostninger i 2023 var 38 mio kr' Dokument 3: 'Virksomheden investerede 5 mio kr i ny teknologi' Spørgsmål: Hvad var virksomhedens resultat i 2023?
Output:
Baseret på de angivne dokumenter: - Omsætning: 45 mio kr - Driftsomkostninger: 38 mio kr - Resultat før investeringer: 7 mio kr Virksomheden havde et driftsresultat på 7 mio kr i 2023.
Hvornår skal du bruge denne teknik?
- →Når du arbejder med store dokumentsamlinger
- →For faktatjek og verificering
- →Ved spørgsmål om proprietær data
- →Til kundeservice med produktkataloger
- →Når modellens træningsdata er forældet
Fordele
- ✓Mere faktuelle og præcise svar
- ✓Kan cite kilder
- ✓Opdateres løbende med ny data
- ✓Reducerer hallucinations
- ✓Perfekt til enterprise use cases
Ulemper
- !Kræver retrieval infrastruktur
- !Mere kompleks at implementere
- !Dyrere at køre
- !Afhænger af kvalitet af dokumenter
- !Langsommere responstid
Tips & Best Practices
- 💡Brug semantisk søgning til at finde relevante dokumenter
- 💡Inkluder kun de mest relevante kilder i prompten
- 💡Bed modellen cite sine kilder
- 💡Test retrieval kvalitet separat
- 💡Kombiner med instruction following for struktureret output