Retrieval-Augmented Generation (RAG)

Advanced

Advanced Reasoning

RAG kombinerer information retrieval med generering. Modellen henter relevant information fra en ekstern kilde (f.eks. database eller dokumenter) og bruger denne til at generere mere præcise, faktuelle svar.

Eksempel

Prompt:

Baseret på følgende dokumenter, besvar spørgsmålet:

Dokument 1: 'Virksomheden havde en omsætning på 45 mio kr i 2023'
Dokument 2: 'Driftsomkostninger i 2023 var 38 mio kr'
Dokument 3: 'Virksomheden investerede 5 mio kr i ny teknologi'

Spørgsmål: Hvad var virksomhedens resultat i 2023?

Output:

Baseret på de angivne dokumenter:
- Omsætning: 45 mio kr
- Driftsomkostninger: 38 mio kr
- Resultat før investeringer: 7 mio kr

Virksomheden havde et driftsresultat på 7 mio kr i 2023.

Hvornår skal du bruge denne teknik?

  • Når du arbejder med store dokumentsamlinger
  • For faktatjek og verificering
  • Ved spørgsmål om proprietær data
  • Til kundeservice med produktkataloger
  • Når modellens træningsdata er forældet

Fordele

  • Mere faktuelle og præcise svar
  • Kan cite kilder
  • Opdateres løbende med ny data
  • Reducerer hallucinations
  • Perfekt til enterprise use cases

Ulemper

  • !Kræver retrieval infrastruktur
  • !Mere kompleks at implementere
  • !Dyrere at køre
  • !Afhænger af kvalitet af dokumenter
  • !Langsommere responstid

Tips & Best Practices

  • 💡Brug semantisk søgning til at finde relevante dokumenter
  • 💡Inkluder kun de mest relevante kilder i prompten
  • 💡Bed modellen cite sine kilder
  • 💡Test retrieval kvalitet separat
  • 💡Kombiner med instruction following for struktureret output

Relaterede Teknikker