Nell’ultimo anno e mezzo ho sviluppato da zero due componenti fondamentali, il motore di ricerca e una pipeline di testing e valutazione automatizzata per un chatbot distribuito a livello nazionale per la Pubblica Amministrazione italiana. Il sistema si chiama Camilla ed è uno strumento rivolto ai cittadini: chiunque può usarlo per cercare tra centinaia di bandi pubblici aperti, dalle offerte di lavoro dei singoli comuni e delle province agli enti nazionali, alle forze armate e a qualunque altro ramo della PA.
Elabora query reali di utenti reali, in un contesto regolamentato, traducendo domande in linguaggio naturale in risposte verificabili e riferite ai bandi che corrispondono alle richieste degli utenti. Quell’esperienza mi ha costretto a fare chiarezza su alcune domande interessanti, relative ai sistemi ibridi di AI. Come si valuta un sistema agentico in modo da cogliere davvero ciò che si rompe in produzione? Come si costruisce un retrieval ibrido su un corpus incoerente per natura? Come si rilascia un prodotto di AI per la PA italiana rispettando gli obblighi di trasparenza dell’AI Act europeo?
Ho scritto dell’architettura e delle decisioni di governance, quelle che si sono rivelate più importanti delle scelte di ML, in un articolo per Agenda Digitale.