Enkey Magazine
Sito di informazione tecnologica

ChatGPT: l’ultimo aggiornamento

Ora può vedere, sentire e parlare

ChatGPT

Il nuovo ChatGPT può ora vedere, sentire e parlare e a molti fa paura… in tutti i sensi. Scopriamo insieme l’ultimo controverso aggiornamento dell’intelligenza artificiale generativa per eccellenza e tutte le sue nuove funzioni.

ChatGPT: l’ultimo aggiornamento

L’ultimo aggiornamento del bot di intelligenza artificiale generativa di OpenAI è stato annunciato il mese scorso, insieme a tutte le sue nuove funzionalità, le quali hanno da subito destato l’attenzione.

ChatGPT
ChatGPT

L’aggiornamento consente all’AI di vedere, sentire e parlare, gestendo i comandi vocali in un modo analogo a un’assistente vocale come Alexa ed esaminando meglio immagini, foto e video.

Questo nuovo aggiornamento, inizialmente disponibile solo per la versione inglese, dovrebbe essere disponibile per tutti gli abbonati alla versione premium entro la fine dell’anno.

Il Bot ora può vedere, sentire e parlare

Le nuove funzionalità di ChatGPT dimostrano come l’azienda stia lavorando al suo modello di intelligenza artificiale generativa. Inoltre, attirando sempre più utenti e raccogliendo sempre più informazioni, l’azienda può continuare ad allenare la propria intelligenza artificiale in vista di un loro obiettivo futuro: creare un’intelligenza artificiale il più possibile simile a quella umana.

ChatGPT
Il Bot può ora vedere, sentire e parlare

ChatGPT diventa sempre più potente e performante ed è in grado di competere con gli altri big del settore dell’AI.

Con le nuove funzioni che gli consentono di interagire con l’utente attraverso i comandi vocali, l’AI diventa sempre più simile agli assistenti vocali, come Alexa o Siri. Tuttavia, le sue capacità e le sue conoscenze sono anche maggiori di quelle di un normale assistente vocale.

Oltre a sentire le nostre domande il bot può anche rispondere ad esse, parlando attraverso un sintetizzatore vocale.

Il bot potrà anche “vedere” oltre a sentire e parlare e lo farà con una maggiore comprensione e gestione delle immagini e dei video. Caricando un’immagine o una foto su ChatGPT questa potrà fornire una didascalia e tutte le informazioni che riguardano l’immagine, in un modo molto analogo a quello che già utilizza Google Lens.

Le nuove funzioni non sono una novità

Detto ciò le nuove funzioni sembrano essere una novità. Alexa e gli altri assistenti vocali sono già in grado di sentire e parlare, mentre Google Lens e strumenti simili sono già in grado di vedere.

Tuttavia, le capacità di comprensione di ChatGPT sono superiori a quelle degli assistenti vocali o a quelle dei tool per il riconoscimento delle immagini.

L’intelligenza artificiale generativa è l’AI più avanzata e quella che maggiormente cerca di avvicinarsi a un’intelligenza umana. Per questo dargli la possibilità di vedere, sentire e parlare la avvicina ancor di più a questo traguardo.

ChatGPT: un modello di AI multimodale

Il nuovo modello dell’intelligenza artificiale generativa di OpenAI viene definito multimodale, ovvero utilizzano diversi sensi per comprendere il mondo che li circonda e i comandi che gli vengono forniti.

ChatGPT
ChatGPT: modello multimodale

Non si tratta più semplicemente di comprendere il linguaggio, ma anche i suoni, le immagini e i video.

Dal punto di vista delle prestazioni, intuitivamente ci aspetteremmo che i modelli multimodali superino quelli addestrati su una singola modalità. Se costruiamo un modello usando solo il linguaggio, imparerà solo quello, a prescindere da quanto sia potente”, spiega Trevor Darrell, professore a Berkley.

ChatGPT è pericoloso?

Dobbiamo sempre ricordarci che il modello di intelligenza artificiale utilizza le informazioni che noi gli forniamo per addestrarsi. Ciò vuol dire anche che dobbiamo fare attenzione se gli forniamo immagini o video personali da analizzare.

Qualsiasi input noi gli forniamo viene utilizzato dal bot per addestrarsi. Tuttavia, abbiamo la possibilità di limitare il tempo durante il quale il bot può conservare le vostre informazioni. È possibile modificarlo attraverso le impostazioni. Disabilitando la funzione “cronologia chat e informazione” le informazioni vengono eliminate automaticamente dopo un mese.

Per quanto riguarda le nuove funzioni, inoltre, non dobbiamo fidarci ciecamente delle risposte fornite dal bot, in quanto questo potrebbe confondersi, soprattutto per quanto riguarda il riconoscimento delle immagini e fornire risposte fuorvianti.

Una grande limitazione per la privacy, infine, è imposta per evitare il riconoscimento delle persone, anche se famose. Non è possibile, infatti, fornire una foto e chiedere a ChatGPT di riconoscere una persona reale. Tuttavia, il bot talvolta aggira la limitazione fornendo alcune informazioni riguardo agli attori, se gli vengono proposte scene di un film.

Potrebbe piacerti anche