I guardrail sono i controlli che stanno tra il modello e il mondo reale: validano input e output, bloccano comportamenti indesiderati, garantiscono formati corretti. Senza guardrail un sistema AI è un prototipo; con i guardrail diventa un sistema di produzione.
Guardrail in input
Prima ancora di arrivare al modello, l'input va filtrato: prompt injection, contenuti fuori tema, dati sensibili da non inoltrare. Trattare l'input come potenzialmente ostile è il punto di partenza.
- Difesa da prompt injection (separare dati e istruzioni)
- Filtri su contenuti vietati o fuori ambito
- Rilevamento e mascheramento di dati sensibili
Guardrail in output
L'output del modello non si usa al volo: si valida. Formato, presenza di citazioni, coerenza con le regole di business, assenza di contenuti vietati. Se l'output non passa, si rigenera, si corregge o si escala.
- Validazione di schema (JSON conforme)
- Controlli di business (valori ammessi, vincoli, range)
- Citazioni e ancoraggio alle fonti per i fatti
- Filtri su tossicità, dati personali, contenuti vietati
output → valida schema → ok?→ applica regole business → ok?→ verifica citazioni → ok?NO in qualsiasi punto → rigenera / correggi / escala a umano
Guardrail come codice, non come prompt
Chiedere al modello “per favore non sbagliare” non è un guardrail. Un guardrail è codice deterministico che verifica e blocca. Il prompt riduce la probabilità di errore; il guardrail garantisce che l'errore non passi.
In sintesi
- I guardrail validano input e output: rendono un prototipo un sistema di produzione.
- Tratta l'input come ostile: difesa da injection e dati sensibili.
- Valida l'output con schema, regole di business e citazioni.
- Un guardrail è codice deterministico, non una richiesta gentile nel prompt.
FAQ tecniche
I guardrail rallentano il sistema?
Aggiungono controlli, ma la maggior parte è leggera (validazione di schema, regole). Il costo è minimo rispetto al rischio di mandare in produzione output non verificati.
Bastano i guardrail del provider?
Coprono sicurezza di base, ma le regole di business e i vincoli del tuo dominio li conosci solo tu. I guardrail applicativi sono indispensabili oltre quelli di piattaforma.