Un'architettura AI è ciò che sta tra un prototipo e un sistema di produzione. Definisce come dati, modelli, strumenti, controlli e monitoraggio si combinano. Sceglierla bene è la differenza tra una demo che impressiona e un sistema che regge i carichi reali.
I pattern principali
Non tutte le soluzioni AI hanno la stessa forma. I pattern più comuni coprono la maggior parte dei casi aziendali, dal più semplice al più complesso.
- Prompt diretto: input → modello → output, per task semplici
- RAG: retrieval + modello, per conoscenza aziendale
- Tool calling: modello che agisce su funzioni e sistemi
- Agentico: il modello decide dinamicamente i passi
- Workflow: passi deterministici con AI nei punti giusti
Cloud, on-premise, ibrido
La scelta di deployment dipende da dati, latenza e controllo. Molte architetture reali sono ibride: modello locale per i dati sensibili, modello cloud per i task complessi, con un router che smista in base a sensibilità e difficoltà.
Gli strati di un sistema serio
Un'architettura di produzione non è solo “il modello”: è una pila di componenti dove ogni strato ha una responsabilità.
Input → validazione, sicurezza, normalizzazioneRetrieval/KB → conoscenza aziendale, filtri permessiModello → scelto per task; eventuale routingTool/Business → azioni su CRM, ERP, API, regoleGuardrail → validazione output, citazioni, policyOsservabilità → logging, metriche, versioningGovernance → ruoli, audit, supervisione
Disaccoppiare dal provider
Un'architettura matura non è incollata a un singolo provider. Un layer di astrazione (o un AI gateway) permette di cambiare modello, usarne più di uno e migrare senza riscrivere il sistema. È governance e continuità operativa insieme.
In sintesi
- L'architettura distingue un prototipo da un sistema di produzione.
- Scegli il pattern (prompt, RAG, tool, agentico, workflow) per il problema.
- Un sistema serio ha strati: input, retrieval, modello, tool, guardrail, osservabilità, governance.
- Disaccoppia dal provider per qualità, continuità e niente lock-in.
FAQ tecniche
Da quale pattern parto?
Dal più semplice che risolve il problema. Spesso prompt strutturato o RAG bastano; agenti e workflow si aggiungono quando il caso lo richiede davvero. La complessità va guadagnata, non assunta.
Quanto conta l'architettura rispetto al modello?
Moltissimo. Un modello medio in una buona architettura batte regolarmente un modello di punta usato male. L'affidabilità sta negli strati intorno al modello.