L'intelligenza artificiale generativa (AI) è estremamente promettente in molti settori e discipline. Tuttavia, come con qualsiasi nuova tecnologia potente, comporta anche nuovi rischi per la sicurezza. Prendiamoci qualche minuto per immergerci nel panorama emergente delle minacce dell'IA generativa, concentrandoci in particolare sulle aree della sicurezza dei dati e dei sistemi. Questo post del blog evidenzierà anche come le organizzazioni possono adottare in modo sicuro questi strumenti, anche con questi rischi.
In che modo l'IA generativa è diversa?
Per comprendere in che modo l'IA generativa cambia il panorama delle minacce, dobbiamo prima considerare in che modo questi nuovi sistemi differiscono dai sistemi tradizionali che sono stati la spina dorsale dei sistemi della supply chain negli ultimi 50 anni. Le prime cinque differenze sono:
- Gli strumenti e le pratiche di sicurezza per l'IA generativa stanno ancora maturando, rispetto alle tecnologie già disponibili per i database. Le vulnerabilità della sicurezza dei database, come l'SQL injection, sono ben comprese, dopo decenni di attenzione. Gli sviluppatori sono ampiamente formati su queste minacce e solidi strumenti di controllo sono integrati nelle pipeline CI/CD. Tuttavia, il percorso verso l'IA generativa è solo all'inizio, con la modellazione delle minacce e gli strumenti che continuano a emergere.
- L'intelligenza artificiale generativa fornisce nuove informazioni, piuttosto che limitarsi a recuperare i record. Mentre i database restituiscono i dati precedentemente archiviati, possibilmente con trasformazioni o calcoli, l'intelligenza artificiale generativa sintetizza nuovi dati in base al suo addestramento. Questo è analogo a un analista che genera intuizioni rispetto a un impiegato che recupera i record.
- I linguaggi di programmazione formali sono prevedibili e inequivocabili, a differenza delle sfumature e dell'ambiguità presenti nel linguaggio naturale utilizzato dall'IA generativa. I database utilizzano linguaggi formali, come SQL, che sfruttano una sintassi formale e comprensibile per accedere ai dati. Una data istruzione SQL, presa nel contesto dei dati già memorizzati, produrrà sempre lo stesso risultato. Tuttavia, l'intelligenza artificiale generativa utilizza un linguaggio naturale "quotidiano", con tutte le sue sfumature e ambiguità, per tutti gli input e gli output. Come due persone che negoziano un contratto, possono verificarsi incomprensioni tra gli esseri umani e le applicazioni di intelligenza artificiale. Inoltre, gli output dell'IA generativa non sono deterministici, il che significa che input identici possono produrre risultati distinti in termini di fraseggio, formulazione o significato.
- L'intelligenza artificiale generativa potrebbe non disporre di funzionalità di tracciabilità e controllo, rispetto ai database con controlli più rigorosi. Con i database, gli utenti autorizzati possono facilmente controllare i dati memorizzati e tracciarne l'origine. Al contrario, i modelli di intelligenza artificiale generativa memorizzano la conoscenza in una rete neurale, in una forma incomprensibile per la maggior parte delle persone. Inoltre, attualmente non sono disponibili tecniche solide per verificare le "conoscenze" acquisite dai modelli di intelligenza artificiale generativa o le potenziali distorsioni dei dati di addestramento.
- L'intelligenza artificiale generativa dispone attualmente di un numero inferiore di controlli di accesso ai dati integrati rispetto ai database. I database dispongono di solidi controlli di autorizzazione che regolano l'accesso ai dati. Tuttavia, l'IA generativa attualmente non dispone di tali controlli integrati. Gli utenti autenticati possono accedere a qualsiasi dato.
L'esame delle differenze tra i sistemi tradizionali e l'intelligenza artificiale generativa rivela nuove vulnerabilità di sicurezza e le mitigazioni necessarie, che possono essere classificate in tre domini chiave: protezione dei dati sensibili, protezione dei sistemi e dei dati dall'uso dannoso e gestione corretta degli agenti e dei plug-in dell'intelligenza artificiale.