GPT-OSS arriva su RTX

Giuseppe Saieva | 6 ago 2025 | 🔊 Ascolta la notizia

GPT-OSS arriva su NVIDIA RTX: l’AI open-source di OpenAI accelera su PC e workstation

NVIDIA e OpenAI hanno annunciato una nuova collaborazione strategica per portare la potenza dei modelli open-source GPT-OSS direttamente su PC e workstation NVIDIA RTX.
Questa iniziativa segna l’inizio di una nuova era per l’intelligenza artificiale locale, offrendo prestazioni di livello data center direttamente su hardware consumer e professionale.

Due modelli GPT-OSS ottimizzati per GPU RTX

La famiglia di modelli open-source comprende due varianti principali, progettate per scenari diversi:

gpt-oss-20b – Modello ottimizzato per PC NVIDIA RTX AI con almeno 16 GB di VRAM, capace di raggiungere 250 token al secondo su una GPU RTX 5090.
gpt-oss-120b – Versione potenziata per workstation professionali con GPU NVIDIA RTX PRO, pensata per carichi complessi e applicazioni di livello enterprise.

Prestazioni e caratteristiche tecniche avanzate

Entrambi i modelli GPT-OSS sono stati addestrati su GPU NVIDIA H100 e supportano la precisione MXFP4 su RTX, una tecnologia che migliora accuratezza e qualità senza compromettere la velocità.
Le specifiche includono:

Contesto fino a 131.072 token, tra i più ampi disponibili per inferenza locale.
Architettura Mixture-of-Experts (MoE) con funzioni integrate come chain-of-thought, gestione delle istruzioni e supporto all’uso di strumenti esterni.

Come iniziare: strumenti e risorse per sviluppatori

NVIDIA ha presentato nel RTX AI Garage della settimana le modalità per sfruttare i nuovi modelli GPT-OSS su GPU RTX:

Ollama App – Interfaccia semplice e ottimizzata per GPU RTX, ideale per test rapidi e implementazioni immediate.
Llama.cpp – Ottimizzazioni open-source sviluppate con la community, incluse CUDA Graphs per ridurre l’overhead. Codice disponibile su GitHub.
Microsoft AI Foundry – Anteprima pubblica per sviluppatori Windows: avvio rapido con il comando Foundry model run gpt-oss-20b da terminale.

Dichiarazione di Jensen Huang, CEO di NVIDIA

Il fondatore di NVIDIA ha commentato così il lancio:

“OpenAI ha dimostrato al mondo il potenziale dell’AI con tecnologia NVIDIA e ora sta accelerando l’innovazione open-source. I modelli GPT-OSS offrono agli sviluppatori la possibilità di costruire su basi all’avanguardia, rafforzando la leadership tecnologica degli Stati Uniti nell’intelligenza artificiale, grazie alla più grande infrastruttura di calcolo AI al mondo.”