OpenAI ha annunciato l'integrazione di una nuova funzionalità di generazione di immagini direttamente all'interno di ChatGpt, battezzata 'ChatGpt immagini'. Resa possibile dal modello omnimodale GPT-4o, la novità consente di creare immagini contestualmente alle conversazioni testuali. ChatGpt immagini è accessibile agli abbonati ChatGpt Plus, Pro e Team, paganti e gratuiti, e in arrivo per Enterprise ed Edu.
Sul blog ufficiale di OpenAI, l'azienda sottolinea le capacità del modello di generare immagini fotorealistiche, pubblicando vari esempi tra cui una grafica di Karl Marx fuori da un centro commerciale negli Stati Uniti. A differenza di altri generatori di immagini IA, che spesso confondono colori e forme, 'ChatGpt immagini' sarebbe in grado di associare correttamente attributi a un numero significativamente maggiore di oggetti. Un progresso riguarda la resa del testo all'interno delle immagini.
Il modello può trascrivere riferimenti testuali coerenti e privi di errori di battitura, superando una delle principali sfide nel campo della generazione di immagini con l'intelligenza artificiale. Un risultato frutto di "molti mesi di piccoli miglioramenti", ha sottolineato al sito The Verge, Gabriel Goh, responsabile della ricerca di OpenAI. Dal punto di vista tecnico, il sistema utilizza un approccio 'auto regressivo', generando immagini in sequenza, simile alla scrittura di testo. Questo si distingue dalla tecnica del modello di diffusione, utilizzata da Dall-e e altri strumenti, che creano l'immagine intera in una volta sola.
Nonostante la qualità dei contenuti, l'azienda ha scelto di non includere filigrane visive nelle immagini realizzate, optando invece per l'inclusione di metadati standard, che ne attesteranno l'origine.
Riproduzione riservata © Copyright ANSA