Una nuova tendenza si sta affermando nel settore dell’intelligenza artificiale, con la SRAM che supera le GPU per l’inferenza. Mentre le GPU continuano a essere essenziali per l’addestramento dei modelli, nella fase di utilizzo pratico da parte degli utenti finali si preferisce un’architettura basata sulla memoria SRAM. Questa evoluzione riguarda specificamente le applicazioni che richiedono velocità e efficienza in tempo reale.

La rivoluzione dell’intelligenza artificiale sta cambiando assetto: mentre l’addestramento dei modelli richiede ancora le potenti GPU, la fase di inferenza — ovvero l’utilizzo pratico da parte degli utenti finali — sta spingendo verso una nuova architettura basata sulla memoria SRAM. Due eventi hanno segnato questo punto di svolta: l’acquisizione della proprietà intellettuale di Groq da parte di Nvidia per 20 miliardi di dollari e il contratto da 750 MW firmato tra Cerebras e OpenAI per gestire i carichi di lavoro. Questa transizione non è solo teorica, ma risponde a un problema fisico reale: nelle attuali GPU, il processore trascorre più tempo ad attendere dati dalla memoria esterna che a calcolare, vanificando gran parte della potenza di calcolo disponibile. 🔗 Leggi su Ameve.eu

