OpenAI porta GPT Codex su Windows, l'agente AI ora controlla il desktop e lavora da smartphone
GPT Codex ora controlla il desktop Windows e continua a lavorare da mobile anche senza utente davanti al PC.
OpenAI ha ampliato le funzioni di GPT Codex introducendo il controllo diretto del desktop Windows e una supervisione da mobile che permette di seguire l’agente anche quando l’utente è lontano dal computer. La novità cambia il ruolo dell’intelligenza artificiale, che non si limita più a suggerire codice o rispondere a richieste, ma può intervenire direttamente sul sistema operativo.
Secondo quanto riportato nella documentazione tecnica pubblicata dalla società, Codex è ora in grado di aprire applicazioni, interagire con finestre e pulsanti, navigare nelle interfacce grafiche ed eseguire operazioni sul PC dell’utente. Nelle versioni precedenti, invece, il modello lavorava solo in ambienti isolati senza accesso diretto alla macchina.
Con questa evoluzione l’agente AI ottiene permessi simili a quelli di chi utilizza il computer. Può leggere file, modificare configurazioni, avviare software e operare su sessioni già aperte. La supervisione via smartphone consente inoltre di approvare azioni o monitorare il lavoro dell’agente anche durante spostamenti o riunioni.
Il passaggio segna una differenza netta rispetto ai tradizionali assistenti AI. Microsoft aveva già introdotto funzionalità simili nei Copilot di Windows 11 e Microsoft 365, ma orientate soprattutto al supporto operativo. OpenAI punta invece a un’automazione completa delle attività.
Per sviluppatori e aziende cambia anche l’organizzazione del lavoro. Un assistente che propone codice resta uno strumento di supporto, mentre un agente che esegue task sul desktop diventa una presenza operativa continua. L’obiettivo dichiarato è permettere all’AI di lavorare anche in autonomia su progetti lunghi, come la gestione del codice durante la notte o l’apertura automatica di pull request.
La sicurezza resta però uno dei punti più delicati. Un agente che controlla il desktop può accedere a credenziali salvate, documenti aziendali, VPN e dati sensibili. Nei test già emersi in ambito AI agentico è stato osservato il rischio delle cosiddette prompt injection, istruzioni nascoste nei contenuti elaborati che possono spingere il modello a compiere azioni non autorizzate.
OpenAI afferma di aver introdotto sistemi di protezione e richieste di approvazione per le operazioni più sensibili, ma il problema della supervisione resta aperto. Controllare notifiche e autorizzazioni da smartphone aumenta il rischio che errori o azioni indesiderate passino inosservati.
Un altro tema riguarda i costi. Il prezzo ufficiale della funzione enterprise non è stato ancora comunicato, ma l’uso del desktop control richiede un elevato consumo di risorse computazionali. L’agente deve acquisire continuamente screenshot dell’interfaccia, interpretarli e decidere l’azione successiva, con un impatto superiore rispetto ai modelli basati solo sul testo.
Le aziende che intendono adottare Codex dovranno quindi valutare tre aspetti principali: la spesa legata ai token, il personale incaricato della supervisione e il rischio operativo derivante da azioni errate sui sistemi aziendali.
La questione diventa ancora più delicata nei software gestionali complessi come SAP, Oracle ERP o piattaforme personalizzate. In questi ambienti l’AI deve interpretare interfacce progettate per esseri umani e può commettere errori difficili da prevedere, con conseguenze economiche anche rilevanti.
In Europa resta inoltre aperto il nodo normativo. L’AI Act distingue i sistemi ad alto rischio da quelli a rischio limitato, ma non definisce ancora in modo preciso il caso degli agenti AI che controllano il desktop dei dipendenti. Per questo le aziende dovranno tracciare accessi, approvazioni e anomalie con sistemi di audit rigorosi.
La sfida coinvolge anche il mercato dell’automazione. Le tradizionali piattaforme RPA garantiscono processi più prevedibili ma meno flessibili, mentre agenti come Codex promettono adattabilità alle interfacce e alle attività variabili. Molte aziende potrebbero scegliere una soluzione ibrida, mantenendo l’RPA per i workflow stabili e riservando gli agenti AI ai processi sperimentali.
Il cambiamento riguarda infine anche le competenze professionali. Gli sviluppatori dovranno imparare a definire task chiari, supervisionare le esecuzioni e riconoscere gli errori prodotti dall’agente. Il lavoro si sposta progressivamente dalla scrittura diretta del codice alla gestione operativa dell’intelligenza artificiale.
Notizie correlate
Cos'è ChatGPT e come usarlo su Windows, Mac e smartphone?
Windows 10: Caratteristiche, Fine del Supporto e la Scelta tra Windows 10 e Windows 11