Akamai ha annunciato AI Grid Intelligent Orchestration, una nuova architettura per l’inferenza distribuita che estende Akamai Inference Cloud su oltre 4.400 sedi edge a livello globale. Secondo quanto comunicato dall’azienda, si tratta della prima implementazione su scala globale del reference design NVIDIA AI Grid nel settore, con l’obiettivo di distribuire i carichi di lavoro di intelligenza artificiale tra infrastrutture edge, regionali e centrali in funzione di latenza, costi e prestazioni.
Il progetto si inserisce nell’evoluzione di Akamai Inference Cloud, piattaforma presentata da NVIDIA nell’ottobre 2025 come soluzione distribuita per portare l’inferenza AI dai data center centrali verso l’edge, con una prima espansione prevista in 20 località globali. Con l’annuncio di marzo 2026, Akamai alza la scala dell’iniziativa e collega la propria rete distribuita a migliaia di GPU NVIDIA RTX PRO 6000 Blackwell Server Edition.
Il cuore del modello è un orchestratore che instrada ogni richiesta verso il livello di calcolo più adatto. NVIDIA descrive questo approccio come una risposta alla necessità di eseguire inferenza più vicino a utenti, dispositivi e dati, così da allineare meglio il costo per token e i tempi di risposta. Nella descrizione del progetto Akamai, la piattaforma abbina ogni richiesta al “giusto tier” di compute per migliorare la cosiddetta token economics dell’inferenza e sostenere casi d’uso in tempo reale in settori come gaming, media, servizi finanziari e retail.
Per Akamai il punto chiave è il superamento del modello delle AI factory centralizzate come unica risposta alla crescita dell’AI. L’azienda sostiene che i carichi di lavoro più sensibili alla latenza, come video in tempo reale, AI fisica, agenti autonomi o esperienze altamente personalizzate, richiedano elaborazione nel punto di contatto e non un passaggio continuo verso cluster remoti. È su questo terreno che Akamai prova a trasferire all’AI la logica che in passato ha guidato l’espansione del content delivery e dell’edge computing.
Dal punto di vista tecnico, l’infrastruttura poggia su componenti NVIDIA AI Enterprise, sull’architettura NVIDIA Blackwell e sulle DPU NVIDIA BlueField per networking e sicurezza accelerati in hardware, secondo quanto indicato da Akamai. Il riferimento NVIDIA AI Grid, inoltre, definisce i blocchi di base per distribuire e orchestrare l’AI su siti distribuiti, includendo computing accelerato, networking e software.
Akamai collega questa architettura a un continuum che va dal core al far edge. In pratica, le sedi edge servono i casi in cui la rapidità di risposta conta più di tutto, mentre i cluster GPU dedicati restano essenziali per i carichi più pesanti, compresi inferenza multimodale e post-training continuo. NVIDIA, nel proprio blog, cita Akamai tra i soggetti che stanno costruendo una AI grid globale proprio con questa logica di distribuzione multilivello.
Le applicazioni indicate da Akamai mostrano bene la direzione del progetto. Nel gaming, l’azienda parla di inferenza con tempi inferiori a 50 millisecondi per personaggi non giocanti basati su AI e interazioni in tempo reale. Nei servizi finanziari, l’idea è usare la rete per marketing iper-personalizzato e suggerimenti rapidi in finestre temporali molto strette. Nei media, il focus cade su transcodifica e doppiaggio in tempo reale. Nel retail, invece, l’attenzione si sposta su strumenti AI in negozio e applicazioni operative presso il punto vendita. Questi esempi provengono dalla comunicazione di Akamai e vanno letti come casi d’uso dichiarati dall’azienda.
C’è poi un elemento di mercato non secondario. NVIDIA segnala che Akamai sta espandendo Inference Cloud come piattaforma AI distribuita su scala globale, mentre Akamai afferma di avere già raccolto una domanda iniziale significativa e cita anche un contratto quadriennale da 200 milioni di dollari per un cluster di migliaia di GPU in un data center progettato per infrastrutture AI metro edge. Questo dato compare nella documentazione diffusa dall’azienda e rappresenta uno degli indicatori più rilevanti del tentativo di costruire una proposta enterprise credibile su larga scala.
Sul piano strategico, la novità conta perché fotografa un cambio di paradigma: l’inferenza non resta più confinata ai grandi poli centralizzati, ma si distribuisce lungo la rete per avvicinare l’intelligenza artificiale al punto in cui nasce la richiesta. Per Akamai, questo significa offrire un modello che prova a combinare reattività locale e scalabilità globale. Per il mercato, significa testare se l’edge potrà davvero diventare uno dei pilastri della prossima fase dell’AI enterprise, soprattutto nei casi in cui pochi millisecondi fanno la differenza.










Scrivi una risposta