Neanche il tempo di dare notizia del lancio di ChatGPT for Clinicians che OpenAI ha presentato il nuovo modello, GPT-5.5. Una rapidità, quella dei lanci di nuovi modelli (negli ultimi mesi OpenAI ha rilasciato, tra gli altri, GPT-5.3 Instant e poi GPT-5.4 con le varianti mini e nano), che segue il possibile rischio fallimento dell’azienda guidata da Sam Altman. Con GPT-5.5, OpenAI presenta un modello ovviamente più potente e performante (almeno nelle premesse) e che punta a ridefinire ancora una volta i parametri di riferimento nel settore dell’intelligenza artificiale.

Segui TuttoAndroid su Google Discover

Offerta

Offerte Amazon Prime Day, scopri quando!

Iscrivi ad Amazon Prime per poter approfittare delle offerte Prime Day, i primi 30 giorni sono gratis!

Cosa cambia con GPT-5.5

Al centro del nuovo modello c’è una comprensione del contesto profondamente migliorata. Secondo OpenAI, GPT-5.5 non si limita a rispondere in modo più preciso, ma è in grado di portare avanti autonomamente attività articolate e multi-fase, come la scrittura e il debug di codice, la ricerca online, l’analisi di dati e la gestione di documenti e fogli di calcolo, senza che l’utente debba supervisionare ogni singolo passaggio. Il modello è stato progettato per pianificare, utilizzare strumenti, verificare i propri risultati e orientarsi nelle situazioni ambigue, proseguendo il lavoro fino al completamento del compito.

Un aspetto tecnico di rilievo riguarda l’efficienza. Nonostante le prestazioni superiori rispetto al predecessore (come prevedibile) GPT-5.5 mantiene la stessa latenza per token di GPT-5.4 e completa le attività utilizzando un numero significativamente inferiore di token, risultando quindi più conveniente nell’utilizzo. Su Terminal-Bench 2.0, un test che misura flussi di lavoro complessi da riga di comando, il modello raggiunge un’accuratezza dell’82,7%, mentre su SWE-Bench Pro, che valuta la risoluzione di problemi reali su GitHub, si attesta al 58,6%.

Al di là dei numeri è interessante registrare alcuni dei casi d’uso riferiti da chi ha avuto accesso anticipato al modello. Dan Shipper, fondatore della società editoriale Every, ha descritto GPT-5.5 come il primo modello di programmazione con una vera chiarezza concettuale. Per verificarlo, ha riprodotto un problema reale, ovvero quello di un’applicazione con un bug difficile da individuare (lo stesso che uno dei suoi migliori ingegneri aveva impiegato giorni a risolvere con una riscrittura parziale del codice) e che GPT-5.4 non era arrivato a una soluzione, mentre GPT-5.5 sì.

Michael Truell, cofondatore di Cursor, uno degli ambienti di sviluppo più usati dagli ingegneri software, ha sottolineato come il modello rimanga concentrato sul compito per periodi di tempo molto più lunghi senza interrompersi. Si tratta di una caratteristica fondamentale per i lavori complessi e di lunga durata che gli utenti delegano a ChatGPT. Un ingegnere NVIDIA ha, probabilmente enfatizzando un po’ pur di dare l’idea, descritto l’eventuale possibilità di rinunciare a GPT-5.5 come alla perdita di un arto.

Oltre a questi esempi, i miglioramenti riguardano anche il comune lavoro d’ufficio. Gli stessi team interni di OpenAI hanno iniziato a usare il modello in modo sistematico per metterlo alla prova. Il team finanziario lo ha impiegato per esaminare quasi 25.000 moduli fiscali per un totale di oltre 71.000 pagine, completando il lavoro con due settimane di anticipo rispetto all’anno precedente. Il team delle comunicazioni ha costruito un agente automatico su Slack per smistare le richieste di intervento, affidando quelle a basso rischio al sistema e riservando quelle più delicate alla valutazione umana. Un singolo dipendente del team commerciale ha automatizzato la produzione di report settimanali, recuperando tra le cinque e le dieci ore di lavoro a settimana.

Sul fronte scientifico, uno dei più indicativi e delicati sui quali i modelli AI vengono testati, GPT-5.5 mostra risultati che vanno oltre il semplice supporto alla scrittura o alla ricerca bibliografica. Derya Unutmaz, professore di immunologia al Jackson Laboratory for Genomic Medicine, ha usato la versione Pro del modello per analizzare una raccolta di dati che misura il livello di attività di migliaia di geni in diversi campioni biologici. Nel caso specifico si trattava di 62 campioni e quasi 28.000 geni, una mole di dati che, elaborata manualmente, avrebbe richiesto mesi di lavoro al suo team.

Bartosz Naskręcki, matematico dell’Università Adam Mickiewicz di Poznań, ha costruito in undici minuti, a partire da un singolo prompt, un’applicazione di visualizzazione di geometria algebrica che in precedenza avrebbe richiesto strumenti dedicati.

In un caso ancora più insolito, una versione interna del modello ha contribuito alla dimostrazione di un nuovo teorema sui numeri di Ramsey, un campo della matematica che studia le condizioni minime perché strutture ordinate emergano in reti o insiemi di grandi dimensioni. Il risultato è stato poi verificato formalmente nel linguaggio di prova Lean.

L’infrastruttura hardware

Solitamente, maggiore è la capacità di un modello, più tempo impiega a elaborare ogni richiesta. Ottenere un modello più potente senza aumentare questi tempi di risposta, una delle peculiarità di GPT-5.5, ha richiesto un ripensamento profondo dell’infrastruttura di calcolo. GPT-5.5 è stato co-progettato e addestrato sui sistemi NVIDIA GB200 e GB300 NVL72, l’hardware attualmente più avanzato per l’addestramento e l’esecuzione di modelli di grandi dimensioni. Una delle ottimizzazioni più significative ha riguardato il modo in cui le richieste vengono distribuite tra i core di calcolo delle GPU. In precedenza il sistema divideva ogni richiesta in un numero fisso di parti, indipendentemente dalle dimensioni. Con GPT-5.5, OpenAI ha analizzato settimane di traffico reale e sviluppato algoritmi su misura per distribuire il carico in modo più efficiente, aumentando la velocità di generazione dei token di oltre il 20%.

Sicurezza e cybersecurity

Nel proprio sistema interno di valutazione dei rischi, OpenAI assegna ai modelli un livello di pericolosità potenziale in base alle loro capacità in settori sensibili. Per GPT-5.5, le capacità nei settori della sicurezza informatica e biologica sono state classificate al livello “High”, il secondo più alto della scala. Questo non significa che il modello sia considerato pericoloso, ma che le sue capacità in questi settori richiedono attenzioni specifiche.

Per la cybersecurity, il modello introduce controlli più stringenti sulle attività ad alto rischio, affiancati da un programma chiamato “Trusted Access for Cyber” che consente a ricercatori e organizzazioni verificate, incluse quelle responsabili di infrastrutture critiche come reti elettriche o sistemi idrici, di accedere a funzionalità avanzate con meno restrizioni. L’obiettivo è mettere gli strumenti più potenti al servizio della difesa, democratizzando l’accesso agli strumenti di sicurezza per chi ne fa un uso legittimo, pur mantenendo controlli sui possibili abusi.

Disponibilità e prezzi

Parallelamente al lancio del nuovo modello, OpenAI ha annunciato un importante aggiornamento dell’app Codex. Tra le novità più rilevanti c’è l’introduzione di un browser integrato, che consente di lavorare direttamente su applicazioni web e progetti frontend senza uscire dall’ambiente di sviluppo, e di un sistema di memoria che permette a Codex di ricordare preferenze e contesto accumulati nelle sessioni precedenti, riducendo la necessità di ripetere istruzioni già fornite in passato.

GPT-5.5 è disponibile per gli utenti con abbonamento Plus, Pro, Business ed Enterprise sia in ChatGPT sia in Codex. GPT-5.5 Pro, la variante pensata per le attività più impegnative e ad alta precisione, è invece riservata ai piani Pro, Business ed Enterprise. L’accesso tramite API è in fase di preparazione; OpenAI ha indicato che sarà disponibile a breve, con un prezzo di 5 dollari per milione di token in input e 30 dollari per milione di token in output, mentre GPT-5.5 Pro in API sarà disponibile rispettivamente a 30 e 180 dollari per milione di token. Nonostante il costo superiore rispetto a GPT-5.4, OpenAI sottolinea che la maggiore efficienza del nuovo modello, che porta a termine gli stessi compiti con meno token, dovrebbe compensare in buona parte la differenza di prezzo per la maggior parte degli utenti.