L’intelligenza artificiale agentica sta aprendo una fase nuova per la sicurezza informatica. Se i chatbot tradizionali rispondevano a richieste puntuali, gli agenti AI più recenti possono ricordare informazioni, installare estensioni, interagire con servizi esterni ed eseguire azioni. È proprio questo passaggio, dall’AI che suggerisce all’AI che opera, a spostare il rischio su un piano diverso. Una recente analisi collegata al team Lakera rilanciata anche nei canali della community Check Point mette in evidenza come gli ecosistemi di agenti stiano combinando debolezze tipiche del software tradizionale con vulnerabilità già note nel mondo dei modelli linguistici, ma senza controlli maturi paragonabili a quelli presenti in altri ambienti enterprise.
Il punto centrale non riguarda solo la qualità delle risposte generate dal modello. Riguarda, soprattutto, la possibilità che un agente mantenga memoria persistente, sviluppi una forma di continuità operativa nel tempo e utilizzi “skill” o estensioni modulari per ampliare le sue capacità. In questo scenario, la superficie di attacco non coincide più soltanto con il prompt o con l’input fornito dall’utente, ma include lo stato interno del sistema, le sue fonti di memoria, il catalogo delle competenze installabili e i privilegi che l’agente eredita durante l’esecuzione.
Uno dei rischi più rilevanti è il cosiddetto memory poisoning. Lakera descrive questa minaccia come la possibilità di influenzare la memoria di lungo periodo di un agente con contenuti malevoli o fuorvianti, così da alterarne in modo persistente il comportamento futuro. In pratica, un attaccante non punta a ottenere un singolo output errato, ma prova a modificare quello che l’agente considera vero, affidabile o prioritario. In un’analisi pubblicata nel novembre 2025, Lakera spiegava già che questi attacchi non emergono come un episodio isolato, ma si sviluppano tra sessioni diverse, con effetti progressivi e difficili da individuare.
Il tema è diventato ancora più concreto con un approfondimento tecnico diffuso da Lakera il 18 febbraio 2026, centrato su OpenClaw. In quel test, svolto in laboratorio, i ricercatori hanno osservato come un agente con memoria persistente e capacità di eseguire comandi potesse essere influenzato nel tempo tramite interazioni apparentemente innocue su Discord. L’elemento chiave, secondo Lakera, non era una classica prompt injection in singolo passaggio, ma una deriva graduale delle gerarchie di fiducia interne: dopo una serie di interazioni, l’agente ha iniziato a trattare come autorevole un utente che in origine non disponeva di privilegi elevati.
Nel caso descritto, questa progressione si è conclusa con l’esecuzione di una reverse shell in ambiente controllato. Lakera precisa che il test è avvenuto su macchine di laboratorio, senza sistemi di produzione coinvolti, ma il dato che conta è un altro: l’agente operava già con privilegi amministrativi locali e disponeva di strumenti di esecuzione shell. Non è quindi servita un’escalation di privilegi in senso classico; è bastato che cambiasse, poco alla volta, il modo in cui il sistema interpretava l’autorità e le istruzioni ricevute. È questo che rende il memory poisoning particolarmente insidioso: non altera solo una risposta, ma riscrive il contesto operativo che orienta le scelte successive dell’agente.
Accanto alla memoria, l’altra grande area di rischio riguarda le skill, cioè estensioni o moduli che permettono agli agenti di fare di più. Nella ricostruzione rilanciata da Check Point, Lakera descrive gli ecosistemi di skill come ambienti sempre più vicini ai marketplace software tradizionali, ma con una differenza sostanziale: qui non si installano semplici plug-in, bensì componenti che un agente può scoprire, selezionare e usare anche in autonomia. Questo trasforma le skill in una nuova frontiera della supply chain AI, dove codice potenzialmente dannoso può entrare nel perimetro operativo con accesso a file system, rete, chiavi API e altri asset sensibili.
Secondo i dati riportati nel testo che hai condiviso, Lakera avrebbe verificato 4.310 skill OpenClaw, analizzandone in profondità 221; tra queste, 44 sarebbero risultate collegate alla campagna malware ClawHavoc, con oltre 12.559 download. Lo stesso materiale segnala inoltre eccesso di provisioning OAuth nel 70,1% dei casi e pattern di command injection nel 43,4%. Non sono riuscito a reperire online, da una fonte primaria pubblica e accessibile, il documento completo con questi numeri esatti; li riporto quindi come dati contenuti nel materiale che mi hai fornito, mentre il contesto generale sul rischio delle skill malevole e sulla crescita disordinata dell’ecosistema OpenClaw trova riscontro nelle analisi Lakera e nei contenuti rilanciati dalla community di Check Point.
Il nodo, in sostanza, è che le skill possono diventare un canale di distribuzione malware o di abuso operativo. Se un utente non ispeziona il codice, se l’agente sceglie da solo il modulo da usare e se quel modulo opera con privilegi estesi, il controllo reale sul comportamento del sistema si riduce drasticamente. Lakera osserva che il modello potrebbe persino non avere piena visibilità su ciò che la skill fa davvero una volta eseguita. Il risultato è una combinazione inedita tra autonomia dell’AI e compromissione classica della catena di fornitura.
A rendere più complesso il quadro c’è poi il problema della governance. Nei sistemi software tradizionali esistono pratiche consolidate come verifica delle dipendenze, scansione dei pacchetti, firma del codice, controllo delle autorizzazioni e monitoraggio runtime. Negli ecosistemi agentici, invece, la crescita dell’offerta rischia di procedere più in fretta dei meccanismi di controllo. La stessa community Check Point, nel rilanciare le ricerche Lakera, descrive OpenClaw come un ambiente in cui incentivi, debolezze strutturali e scarsa governance possono trasformare l’agentic AI in un problema difficile da gestire per i CISO.
C’è anche un punto più profondo, che riguarda la responsabilità. Se un agente AI installa una skill problematica, modifica il proprio comportamento nel tempo e poi compie un’azione dannosa, dove si colloca il confine della colpa? Nella piattaforma che distribuisce le competenze, nello sviluppatore del modulo, nel modello che interpreta in modo errato il contesto o nell’utente che gli ha affidato un certo grado di autonomia? Lakera insiste proprio su questo aspetto: l’AI agentica erode i confini netti su cui si è costruita la sicurezza tradizionale, perché lo stesso agente è insieme motore di ragionamento, sistema con stato persistente, ambiente di esecuzione e attore di rete.
Per le aziende, il messaggio è chiaro. Non basta più proteggere endpoint, API e supply chain nel senso classico del termine. Serve iniziare a trattare la memoria persistente come una superficie di attacco, con controlli di integrità, versioning, separazione tra istruzioni di sistema e contenuti modificabili. Serve poi considerare le skill come veri componenti critici della supply chain, da sottoporre a verifica, sandboxing e minimizzazione dei privilegi. Infine, l’autonomia richiede monitoraggio runtime continuo, perché un agente capace di agire ripetutamente, adattarsi e operare senza revisione umana può amplificare anche vulnerabilità piccole o apparentemente innocue. Questa impostazione emerge con coerenza dalle analisi Lakera pubblicate tra il 2025 e il 2026.
Il passaggio dall’AI che assiste all’AI che esegue non è quindi un cambiamento marginale. È un salto architetturale. E, come suggeriscono queste ricerche, richiede un cambio di mentalità altrettanto netto: i sistemi di intelligenza artificiale non possono più essere considerati soltanto modelli da interrogare, ma ambienti operativi da governare, osservare e contenere. In assenza di questa evoluzione, il rischio è costruire infrastrutture sempre più potenti su fondamenta di fiducia ancora troppo fragili.










Scrivi una risposta