RAG e fine tuning risolvono problemi diversi e spesso vengono confusi. RAG porta conoscenza nel contesto al momento della risposta; il fine tuning modifica il comportamento del modello. Sceglierli bene evita di pagare il problema sbagliato.
Cosa fa il RAG
Retrieval-Augmented Generation recupera documenti pertinenti da una knowledge base e li inserisce nel contesto, così il modello risponde su informazioni reali e aggiornate. La conoscenza resta esterna: la aggiorni cambiando i documenti, non il modello.
- Ideale per conoscenza che cambia spesso (procedure, listini, FAQ, manuali)
- Risposte ancorabili alle fonti, quindi verificabili
- Aggiornamento immediato: basta reindicizzare i documenti
Cosa fa il fine tuning
Il fine tuning riaddestra il modello su esempi per modificarne stile, formato o comportamento ripetibile. Non serve a “insegnare fatti”: serve a far comportare il modello in un certo modo in modo consistente.
- Ideale per tono di voce, formato rigido, task molto ripetitivi
- Riduce la lunghezza dei prompt se il comportamento è “interiorizzato”
- Richiede un dataset di qualità e va rifatto quando cambia l'obiettivo
Come scegliere
La domanda giusta non è “RAG o fine tuning”, ma “il mio problema è di conoscenza o di comportamento?”. Spesso la risposta è: prima RAG, fine tuning solo se resta un gap di comportamento.
Problema di CONOSCENZA (cosa sa) ........ → RAGProblema di COMPORTAMENTO (come risponde) → fine tuningEntrambi ............................... → RAG + fine tuning leggeroNel dubbio ............................. → parti da RAG
In sintesi
- RAG = conoscenza esterna aggiornabile; fine tuning = comportamento del modello.
- Per conoscenza aziendale che cambia, RAG è quasi sempre la scelta giusta.
- Il fine tuning non insegna fatti: serve a stile, formato e consistenza.
- Parti da RAG; aggiungi fine tuning solo se resta un gap di comportamento.
FAQ tecniche
Posso evitare il fine tuning del tutto?
Nella maggior parte dei casi aziendali sì. RAG, prompt ben strutturati e tool calling coprono moltissimi scenari senza i costi e la rigidità del fine tuning.
Il fine tuning riduce le allucinazioni?
Non in modo affidabile. Anzi, può fissare comportamenti errati. Per la verità sui fatti serve RAG con fonti, non fine tuning.